o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」
魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor
阅读全文魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor
阅读全文机器之心编辑部今年 1 月,DeepSeek 发布了一项名为 Engram(条件记忆)的技术,在大模型圈子里掀起不小波澜。它的核心思想很简单:别让模型死记硬背常识,直接给它一个「外挂记忆库」。具体做法
阅读全文编辑|PandaTransformer 是当前 LLM 大发展的核心基础,但也有不少顶尖研究者更愿意探索其它道路。在这其中,甚至包括 Transformer 的创造者之一、Sakana AI 创始人联
阅读全文作者介绍:刘梦源,北京大学深圳研究生院研究员,研究领域为人类行为理解与机器人技能学习;盛举义,北京大学在读博士研究生,研究方向为机器人操作技能学习方法研究;王梓懿、李培铭,北京大学在读硕士研究生,研究
阅读全文作者 | 白铂 博士白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家引言本篇是《大模型的第一性原理》系列解读文章的第二篇(点击回顾第一篇),我们将从信号处理的角度解读原论文[1]。重
阅读全文编辑|杜伟谷歌世界模型,再一次惊艳了所有人!今天一早,谷歌 DeepMind 开放了世界模型 Genie 3 的实验性研究原型「Project Genie」,允许用户创建、编辑并探索虚拟世界。在世界模
阅读全文近年来,大模型在数学推理、代码生成等任务上的突破,背后一个关键技术是 RLVR(Reinforcement Learning with Verifiable Rewards)。简单来说,RLVR 不是
阅读全文编辑|泽南、Panda今天上午,上海创智学院 OpenMOSS 团队联合初创公司模思智能(MOSI),正式发布了端到端音视频生成模型 —— MOVA(MOSS-Video-and-Audio)。作为中
阅读全文编辑|杨文AI 网红们在社交平台上混得风生水起。他们手握品牌合作,还坐拥百万粉丝,但很多人至今不知这些都是 AI 生成的,依然像追真人明星一样互动、点赞、被种草。视频来源:X 博主 @thetripa
阅读全文编辑|冷猫你想象中真正的 AI 是什么样子的?至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗?当前最先进的大模型系
阅读全文编辑|+0最近,一段「威尔·史密斯吃意面」的今昔对比视频在社交媒体刷屏,引发了无数感慨。两年前,初出茅庐的 AI 视频还是「抽象鬼畜」的代名词,五官乱飞、逻辑崩坏;仅仅两年过去,当同一主题再次被演绎,
阅读全文机器之心编辑部在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?一个普遍的解法是「测试时搜索」(Test-time search),即提示一个冻结的(不更新参数
阅读全文1. 深度学习下的场景理解:从密集网格到对象中心表征单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术,其目标是仅通过单
阅读全文编辑|Youli你的下一个视频团队,不一定非得是人。做电商的朋友,一定对这样的时刻不陌生:前期找团队、磨脚本、拍视频,筹备了半个月,好不容易在亚马逊或 TikTok 后台上新一款潜力爆款。谁想到,半夜
阅读全文机器之心编辑部一觉醒来,我们看到了微软自研 AI 芯片的最新进展。微软原定于 2025 年发布的下一代 AI 芯片 Maia 200,终于在今天问世!微软 CEO Satya Nadella根据微软官
阅读全文过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到
阅读全文编辑|杨文2026 年,AI 大模型的军备竞赛仍在继续。各家公司争相发布更强大的模型版本,比拼参数量、推理速度、benchmark 得分,整个行业陷入了一种近乎狂热的「性能偏执」。在这种逻辑下,大部分
阅读全文编辑|张倩、陈陈过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指
阅读全文近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ,带来极高的显存占用和延迟,限制了模型
阅读全文编辑|杨文许多人梦想进入像 OpenAI 这样的前沿实验室从事研究工作,然而对于那些缺乏传统学术背景,比如没有发表过论文或知名导师推荐的人来说,这条路似乎格外艰难。最近,OpenAI 资深研究科学家
阅读全文编辑|杨文你的童年我的童年好像不一样。我的 17 岁,是坐在教室里苦哈哈地刷数学卷子;而这个名叫 Enrique Barschkis 的高中生,利用课间休息时间,成功解决了困扰数学家多年的埃尔德什第
阅读全文论文第一作者为清华大学博士、南洋理工大学博士后李寿杰,清华大学博士生吴同和人工智能硕士生徐建乐。论文通讯作者包括清华大学深圳国际研究生院副教授丁文伯,大连理工大学教授解兆谦,新加坡国立大学助理教授吴昌
阅读全文机器之心编辑部自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence) 以来,这家新公司便引发了业界的高度关注。本周,
阅读全文编辑|Panda刚刚,OpenAI CEO 山姆・奥特曼发了一条推文:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这个主题。当然,和奥特曼的
阅读全文从模型重编程(Model Reprogramming),到参数高效微调(PEFT),再到当下大模型时代的 Prompt Tuning ,Prompt Instruction 和 In-context
阅读全文编辑|杜伟、泽南今天一早,OpenAI CEO 奥特曼就发推晒收入,「仅我们的 API 业务而言,上个月就增加了超过 10 亿美元的 ARR(年度经常性收入)。」他继续说到,大多数人只看到了 Chat
阅读全文编辑|Panda、泽南前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量更是已经超过了 700 万。而现在,我们迎来了一个对这
阅读全文在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。为
阅读全文编辑|泽南在医疗健康这一容错率极低的领域,大模型不再凭空「想象」,而是已变得严谨可靠、能引会搜:百川刚刚推出的新模型,实现了一个里程碑式的突破。本周四,百川智能正式发布新一代大模型 Baichuan-
阅读全文编辑|陈陈、冷猫刘壮带队的无需归一化 Transformer 又有新的版本了。一直以来,在 Transformer 架构里,LayerNorm 几乎是标配,但它也有明显问题:比如计算和访存成本高,尤其
阅读全文