小模型读书大模型思考:上海AI Lab提出新知识推理解耦方法DRIFT,高效且「防越狱」
本文主要完成单位为上海人工智能实验室,主要作者谢文轩、谭鑫、陆超超、胡侠等,通讯作者为实验室青年研究员汪旭鸿。当长上下文成为负担:我们是否真的需要「把一切都塞进推理模型」?当前,随着大家对大模型推理能
阅读全文本文主要完成单位为上海人工智能实验室,主要作者谢文轩、谭鑫、陆超超、胡侠等,通讯作者为实验室青年研究员汪旭鸿。当长上下文成为负担:我们是否真的需要「把一切都塞进推理模型」?当前,随着大家对大模型推理能
阅读全文编辑 | 泽南AI 视频赛道的竞争,已经跨过了比拼谁生成视频更长、更逼真的初级阶段,正在迈向实时交互、模拟真实物理规律的技术分水岭。在这个重要节点上,一家成立不到三年的中国创业公司率先抢跑,还顺势拿下
阅读全文编辑|杨文最近,谷歌 NotebookLM 又出了个好玩好用的小功能:Cinematic Video Overviews(电影级视频概览)。与普通模板不同,这项功能可以根据我们上传的资料,自动生成定制
阅读全文论文第一作者为魏彤,清华大学在读博士生,研究方向为大模型智能体和强化学习,导师为清华大学兴军亮、史元春;共同一作为腾讯杨一君;合作者为北京大学卢宗青;通讯作者为叶德珩。基于可验证奖励的强化学习(Rei
阅读全文机器之心编辑部速度、质量、管线可用性,是 AI 3D 生成领域公认的不可能三角。三件事,从来没有同时成立过。直到现在。VAST 最新发布的 Tripo P1.0,首次在原生三维空间中实现概率生成,2
阅读全文机器之心发布一个月前我们发布了基于华为 openJiuwen 开源社区构建的 DeepAgent 和 DeepSearch 两款智能体双双霸榜 [DeepAgent与DeepSearch双双霸榜!答案
阅读全文最近,一个叫OpenClaw(小龙虾)的开源项目突然爆火,甚至出现线下排队安装的场面。很多人第一次直观地看到,AI不只是chatbot,而是可以真正“动手”操作电脑、完成复杂任务和个性化工作流的智能体
阅读全文如今,Test-Time Scaling(测试时扩展)已成为提升模型推理能力的关键路径。而在这一浪潮中,块扩散语言模型(Block Diffusion Language Models, BDLMs)
阅读全文机器之心编辑部谁能想到,OpenClaw 火到了今天,甚至出现了排队等待安装的盛况。一些大厂也开始入局,选择接入 OpenClaw。龙虾热已经发展为现象级,但问题是:究竟有多少行业能够真正将其投入使用
阅读全文机器之心编辑部在「龙虾热」蔓延全国的此刻,大家把越来越多的工作交给 AI。从写代码到数据分析,很多人开始尝试让 AI 接管完整流程。人工智能能力的跃升似乎正逼迫着人们直面「自我价值」的拷问:「AI 会
阅读全文随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行,“记忆该如何设计” 正在成为一个绕不开的核心问题。 论文标题:PlugMem: A Task-Agnostic Plugin Me
阅读全文一、引言在生成式 AI 浪潮中,文生图技术已实现跨越式发展,在视觉呈现上达到了前所未有的高度。然而,在生成图像中准确合成拼写正确、结构规范且风格协调的文字 —— 视觉文本渲染(Visual Text
阅读全文编辑|Sia硅谷投资圈惊呼,科技研究领域的谷歌地图来了!几乎一夜间,海外社交平台上的科技投资人、科学家都在聊它!这就像是科学研究领域的谷歌地图时刻。硅谷科技投资人 David Keel 的这句评价,直
阅读全文编辑|杜伟最近,Karpathy 玩 Vibe Coding 真真地上瘾了!上周末刚开源了「autoresearch」项目:给 AI Agent 提供一个规模虽小但真实可用的 LLM 训练环境,然后让
阅读全文机器之心编辑部2026 年伊始,AI 的进化逻辑正从「单一工具赋能」转向「场景深度共生」,当大模型在各领域持续突破,前沿科研与新材料研发领域,正迎来一场由 Agentic AI 驱动的效率革命。从传统
阅读全文本文第一作者廖海旭为新泽西理工学院数据科学系在读博士生,师从Prof. Shuai Zhang。论文标题:Theoretical Analysis of Contrastive Learning un
阅读全文编辑|冷猫这两年,大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营,为了在指标上领先对手,都在疯狂地卷 Scaling Law,卷算力,卷参数量,已经达到了近乎离谱的程度。过去,GPT-2 只有约 1
阅读全文本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。当前,LLM 评测的通用榜单和常用基准陆续暴露出区分度下降、评审口径波动与数据污染等问题,促使业界愈发重视 LLM 评测体
阅读全文在 AI 视觉生成领域,扩散模型(DM)凭借其强大的高保真数据生成能力,已成为图像合成、视频生成等多模态任务的核心框架。然而,预训练后的扩散模型如何高效适配下游应用需求,一直是行业面临的关键挑战。近日
阅读全文编辑|杜伟OpenClaw 火爆的盛况至今仍在持续,在国内甚至出现了排队在腾讯总部楼下等待安装 OpenClaw 的场景,让人感叹「一代人有一代人的领鸡蛋」。而就在几天前,谷歌发布了一个 CLI(命令
阅读全文编辑|冷猫前沿 AI 研究曾经是由「肉身计算机」完成的:人们在吃饭、睡觉、娱乐之间抽时间做研究,并且偶尔通过一种名为「组会」的仪式,用声波互联(也就是交谈)来同步信息。那个时代已经一去不复返了。如今,
阅读全文1. 真正的高级智能,在于认知自己的 “无知”如果把当下最强的大模型(如 GPT-5.2、Gemini-3 Pro)丢进一个从未去过的虚拟房间,让它自己探索并构建地图,它能做到吗?一直以来,我们评估多
阅读全文编辑|Sia、Panda春节期间, Seedance 2.0 爆火,堪称现象级,这也再次把视频生成推上风口。前两天,字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 H
阅读全文机器之心编辑部近日,Anthropic 公布了一组惊人的数字,在与 Mozilla 公司进行合作,测试旗下模型 Claude Opus 4.6 发现漏洞能力的过程中,两周内,就找出 Mozilla 公
阅读全文机器之心编辑部电子游戏一直是 AI 领域发展的极大推动力之一。游戏本身就构建了一个相对完整的世界,并且具有相当易于理解的世界规则。不仅可以训练人工智能对物理世界的理解,训练智能体的交互,更是许多世界模
阅读全文当大模型推理进入 Parallel Thinking 时代,一个关键问题随之出现:模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问
阅读全文编辑|泽南AI 领域最前沿的方向「世界模型」,正在出现一场革命。互联网上,OpenClaw 的「赛博龙虾」在虚拟数字世界中灵活穿梭,无所不能;现实中,具身机器人却依然受困于试验场的围栏,难以迈向复杂的
阅读全文机器之心编辑部经过一年的努力,FlashAttention-4 终于正式上线了。近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者
阅读全文该论文由大连理工大学、快手可灵团队、香港中文大学联合完成,第一作者王清和是大连理工大学在读三年级博士,研究方向为视频生成,师从卢湖川、贾旭教授,目前在快手可灵团队实习。个人主页:https://qin
阅读全文编辑|张倩导读:近日,位于中关村的深度机智全球首次使用全新范式——人类学习,在多个国际 Benchmark 上取得 SOTA,史无前例地使用全新架构(仅使用人类第一视角数据、零真机数据)击败 Phys
阅读全文