大模型训练方法与数据集技术基本原理
模型训练学习方法有监督学习有监督学习:AI 模型使用被标注了的数据样本进行学习,通过样本的真实值和预测值来求得 Loss 值。有监督学习因为需要对数据样本进行标注,所以只适用于数据量较小的场景。MP
阅读全文模型训练学习方法有监督学习有监督学习:AI 模型使用被标注了的数据样本进行学习,通过样本的真实值和预测值来求得 Loss 值。有监督学习因为需要对数据样本进行标注,所以只适用于数据量较小的场景。MP
阅读全文用Cowork来转录一下视频字幕,发现完全不可用,最后还是用本地的命令行来解决的,瞬间完成,而且根本不需要官方订阅,用国产的就可以。Claude Cowork 是 Anthropic 在 Claude
阅读全文欢迎收看最新一期的 Hunt Good 周报!在本期内容你会看到:8 条新鲜资讯3 个有用工具1 个有趣案例3 个鲜明观点Hunt for News|先进头条😂 韩国砸钱搞「国产 AI」翻车:五进三用
阅读全文📢 本周 AI 快讯 | 1 分钟速览🚀1️⃣ 🧠 DeepSeek 发布 Engram 论文 :提出条件记忆新稀疏轴,将静态知识与动态推理解耦,Engram-27B 在等参数约束下全面超越 MoE
阅读全文> 作者:企鹅火烈鸟🦩引言上一章我们聊了mini-sglang的前端调度逻辑,这一节,我们就深入拆解它的KV Cache管理机制与调度核心逻辑。重点搞懂mini-sglang特有的前缀复用KV Cac
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......前段时间,雷科技揭晓了年度“灯塔产品”,那些代表行业顶尖水准的设备赢得了掌声与认可。然而,灯塔之
阅读全文👆戳视频看👁大部分AI都在卷参数刷榜单,大部分Agent都只会给方案做指导,唯独千问走通了一条更难更正确的路,它让AI俯下身来服务每一个普通人,它不炫技,但它能帮你办妥事情。#科技 #AI #Agen
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......自2022年iPhone 14 Pro将「灵动岛」设计带到手机市场以来,截至2026年1月,除努
阅读全文是时候给Pygame RPG添加一些音乐和声音元素了。如果没有合适的配乐,你就不可能创造出一款具有沉浸感和吸引力的游戏。同样地,游戏中的各种功能和行动如果没有突出行动的良好音效,也会显得平淡无奇。Mu
阅读全文AI 可能会让科学研究变得越发高效,但同时也可能让科学探索变得愈发保守。作者丨郑佳美编辑丨岑峰在当代科学研究中,人工智能正在改变的不只是研究效率,而是科研活动本身的结构。随着 AI 工具在自然科学中的
阅读全文揭秘AI4S如何攻克玻色因手性分离与核心限速酶稳定性难题,开启生物智造的“确定性时代”。作者丨岑峰2026年1月9日,“第四届合成生物学及生物制造大会”在深圳光明隆重召开。在“AI生物制造专场”上,深
阅读全文最近这段时间,我一直在深度玩转 Claude + Skills(Agent Skills),慢慢摸索出一套模块化、可重复利用、还能自动跑起来的 Skills 体系。根据我的亲身实践,一个真正好用的 C
阅读全文核心概念、架构与更多实践…随着2025年的过去,各类基于 LLM 的系统架构已被广泛采用,并在诸多任务上展现出高效性。其中,Retrieval-Augmented Generation (RAG) 无
阅读全文整理 | 华卫 昨日,Cursor 的 CEO Michael Truell 在 X 上发帖表示,其在 Cursor 开发环境中,基于 GPT-5.2 构建了一款浏览器,并实现了连续一周无间断运行。据
阅读全文编译 | 傅宇琪 编辑 | Tina Coding agents(编码智能体) 已成为应用型 AI 中最活跃的领域之一,但许多团队在模型或服务商更迭时,仍不断重复构建脆弱的基础设施。那么,如何在生态不
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】GPT-5.2连肝7天造出浏览器的事,刚刚被打假了!一位开发者发文证实,Cursor这个项目就是个「AI泔水」,代码根本无法编译。Cursor这
阅读全文新智元报道 编辑:KingHZ【新智元导读】Transformer曾是AI革命的巅峰之作,但其发明者Llion Jones警告:它并非终点。就像RNN被取代一样,当前无数微调研究可能只是局部优化
阅读全文新智元报道 编辑:元宇【新智元导读】OpenAI和Anthropic的战火,烧向了一个更贵、更难、也更贴近每个人健康的医疗领域。Claude不仅能写代码,还能帮你看病了?相信你对这样的瞬间一定不
阅读全文到 2030 年,70% 都将发生变化。👦🏻 编译: Bella🥷 编辑: Koji🧑🎨 排版: NConLenny's Podcast 是十字路口团队最喜欢的硅谷播客之一,我们几乎每期必听(没时间
阅读全文4600 万人围观,Claude 又搞了个大新闻。这次不是什么模型升级或者突破性研究,而是一个看起来平平无奇的桌面应用——Claude Cowork。视频发出去 3 天不到,就成了历史上所有预览版产品
阅读全文编辑|泽南、杨文这一天终于还是来了。周六凌晨,OpenAI 的一则公告引起轩然大波:他们计划在 ChatGPT 里加广告了。对此,网友们感到很受伤。有人表示,现在大家用大模型的一个重要原因就是能够避免
阅读全文随着人工智能在代码以及图片生成方面日益成熟,越来越多的研究人员也开始关注 AI 模型在游戏领域中的表现。实际上,游戏在 AI 的发展早期就已经是一个重要的研究方向,许多前期研究聚焦在 Atari,星际
阅读全文从 GPT-4o 开启全能(Omni)交互时代至今,Speech LLM 虽然在拟人化和低延迟上取得了长足进步,但面临一个令人困扰的现象:当大语言模型(LLM)被赋予 “听觉” 后,它的智商下降了。即
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI硅谷最贵的一场官司,有了新进展。马斯克诉OpenAI案,法庭一口气解封超过100份证词文件,爆出太多猛料。奥特曼隐瞒他通过YC基金间接持有OpenAI
阅读全文IDEA团队 投稿 量子位 | 公众号 QbitAI3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本,训练效果有待提升。近年来使用成熟海量的2D实例分割数据来辅助实现3D实例分割成为了一个极
阅读全文OpenAI 今天官宣:未来几周内,将在美国开始测试 ChatGPT 广告测试范围是免费用户和新推出的 ChatGPT Go 用户(这个套餐 8美金/月,后面会细聊)而 Plus、Pro、Busin
阅读全文作者|周一笑邮箱|zhouyixiao@pingwest.com1月12日,Anthropic发布了一款新产品Cowork。官方给它的定义很有意思:Claude Code for the rest o
阅读全文今天看完了All-In Podcast的硅谷四巨头2026年度预测,整整81分钟,信息量炸裂。坐在麦克风前的是掌管数百亿美元的硅谷核心人物:Chamath Palihapitiya(Facebook早
阅读全文天下没有免费的午餐,如果有,那你就是午餐。这个道理,放在硅谷最烧钱的 AI 产品身上也一样适用。就在刚刚,OpenAI 正式宣布了一项里程碑式的决定:将在 ChatGPT 的免费版和入门订阅层级「Ch
阅读全文