机器之心

CVPR 2026 Highlight | 超越传统检索方法！我们的激光雷达重定位方法在精度和效率上双丰收
作者：机器之心发布日期：2026-05-03 13:34:44
在自动驾驶的日常测试视频里，我们常能看到这样的场景：一辆无人车驶入幽深的地下车库，GPS 信号瞬间罢工，它只能靠激光雷达扫描周围环境，试图弄清楚 “我在哪”。然而，车辆可能已经原地掉头，拐过了好几个弯
阅读全文
这套题，GPT-5.5、Opus 4.7加起来没考到「1分」，人类却拿了满分100？
作者：机器之心发布日期：2026-05-02 13:31:12
机器之心编辑部在大模型「卷生卷死」的今天，大家似乎已经习惯了模型在各大榜单上刷出逼近满分准确率。然而，在一项名为 ARC-AGI-3 的基准测试中，堪称当下「最红炸子鸡」的两款顶尖模型 ——OpenA
阅读全文
ACL 2026 | RouteMoA：无需预推理的动态路由，实现高效多智能体混合
作者：机器之心发布日期：2026-05-02 13:31:12
本篇论文已被 ACL 2026 接收，主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。团队负责人为关新平教授，指导老师为陈彩莲教授和乐心怡教授，合作作者还包括南洋理工大学陶大程教授。其他
阅读全文
有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了
作者：机器之心发布日期：2026-05-01 13:00:00
机器之心编辑部最近，研究人员李博杰在 arXiv 发布论文，提出一个名为「不可压缩知识探针」的评测框架，尝试仅通过黑盒 API 调用，来逆向估算任意 LLM 的参数规模。论文标题：Incompress
阅读全文
强化学习的进化：从PPO到MaxRL，LLM推理训练的算法演进史
作者：机器之心发布日期：2026-05-01 13:00:00
机器之心编译强化学习已成为 LLM 后训练技术栈中最重要的技术之一。它是促成 GPT-3 向 InstructGPT 转变的关键要素。此后，它也成为当前这波推理能力提升浪潮的核心。第一代针对 LLM
阅读全文
Generalist之后，罗剑岚团队推出LWD，也要变革具身智能训练范式
作者：机器之心发布日期：2026-04-30 12:49:26
编辑｜泽南这一次，具身智能的范式算是彻底升级了。智元机器人的办公室里，最近员工们一上班就能看到机器人熟练地切着水果：有梨有黄瓜，一通操作完了之后装进破壁机，打成了健康饮料端上来：同样一套设备也能玩转调
阅读全文
哈萨比斯出的难题，GPT之父接上了：用一个知识停在1930年的模型
作者：机器之心发布日期：2026-04-30 12:49:26
机器之心编辑部「一个训练数据截止到 1911 年的模型，能不能自己推导出爱因斯坦 1915 年提出的广义相对论？」今年年初，哈萨比斯给出了一个极其硬核的 AGI 判定标准。没想到的是，这件事真的有人尝
阅读全文
ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展
作者：机器之心发布日期：2026-04-30 12:49:26
论文链接：https://arxiv.org/pdf/2604.16042github 链接：https://github.com/PKU-PILLAR-Group/Survey-Intrinsic-
阅读全文
诺奖得主实验室走出的中国团队，正用世界模型重构生命分子设计
作者：机器之心发布日期：2026-04-29 11:08:19
机器之心发布过去几年，AI4Bio 最深入人心的突破，莫过于 Google DeepMind 开发的 AlphaFold。它让 AI 大规模、接近实验精度地 “看见” 蛋白质结构。到了 AlphaFo
阅读全文
无需训练，如何提升黑箱VLM？CARPRT用「类别感知」给出答案
作者：机器之心发布日期：2026-04-29 11:08:19
近年来，视觉-语言模型（Vision-Language Models, VLMs）如 CLIP 的出现，彻底改变了图像理解的范式。其中，零样本分类作为 VLM 的核心优势之一，无需额外标注数据即可完成
阅读全文
让大模型理解真实医疗视频，全球首个开源技术方案来了！
作者：机器之心发布日期：2026-04-28 15:40:59
编辑｜冷猫让 AI 进入医疗领域，是一件需要慎之又慎的事情。在这种事情上，总有人走得特别激进。今年 2 月，路透社发布了一篇调查报道，标题触目惊心 ——《As AI enters the operat
阅读全文
openJiuwen社区首发「Coordination Enginnering」，让智能体从「单兵作战」到「精锐团队」
作者：机器之心发布日期：2026-04-28 15:40:59
机器之心编辑部从Prompt Engineering提示词工程、Context Engineering上下文工程，到如今爆火的Harness Engineering，围绕大模型的落地方法论持续升级，核
阅读全文
ACL 2026｜答得更准还写得更短？华为泰勒实验室提出SHAPE，给LLM推理装了个「推理税」
作者：机器之心发布日期：2026-04-28 15:40:59
用强化学习训练大模型做数学推理，一个经典的尴尬局面是：模型要么答对了但废话连篇，要么写了一大堆最后答错了，而你根本不知道它到底在哪一步走偏的。来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了
阅读全文
从99行代码复刻冰雪奇缘，到引领3D AI，胡渊鸣的公司凭什么「爆火欧美」？
作者：机器之心发布日期：2026-04-27 08:01:11
编辑｜张倩不知道大家有没有注意到，身边的朋友，买 3D 打印机的是越来越多了。以前，谁要玩 3D 打印，那纯粹是「有闲钱」「爱动手」的表现。但如今，就像罗永浩在他的科技春晚中提到的，一款开箱即用的 3
阅读全文
苹果新论文发出惊人一问：What do your logits know?
作者：机器之心发布日期：2026-04-27 08:01:11
编辑｜Panda近日，有个大新闻：执掌苹果超过 14 年的蒂姆・库克宣布将于 9 月正式卸任 CEO 职位，将接力棒交接给现任硬件工程高级副总裁约翰・特努斯。回顾库克时代，人们津津乐道于他极致的供应链
阅读全文
ACL 2026 | 别轻易给AI发「～」，它可能会删掉你的整个主目录
作者：机器之心发布日期：2026-04-27 08:01:11
本文第一作者降伟鹏，西安交通大学在读博士生，主要研究方向为大模型安全与自动化测评。共同第一作者张笑宇，南洋理工大学博士后研究员，研究方向为软件工程、大模型安全与人机交互。通讯作者沈超，西安交通大学二级
阅读全文
终于，学界找到了深度学习的「牛顿定律」
作者：机器之心发布日期：2026-04-26 11:49:15
编辑｜冷猫深度学习到底有没有科学理论？这是一个很微妙的时代。一边是大模型以令人眩晕的速度迭代，参数量从百亿冲向万亿；另一边是学术界的一片沉默 —— 我们依然没有找到深度学习的基本理论，神经网络仍然是个
阅读全文
剪映上线AI助手，熬夜剪片的苦日子终于到头了
作者：机器之心发布日期：2026-04-26 11:49:15
编辑｜杨文剪辑是个苦差事。每当领导丢来一堆素材，留下一句「剪个宣传片」，我们就知道今晚又得点灯熬油了。素材散落在不同文件夹里，需要逐个导入、预览、筛选；要是再配个解说词，我们还得先绞尽脑汁写文案，找个
阅读全文
大模型高效推理新答案：ICLR 2026提出Balanced Thinking，精度提升10.0的同时，推理长度直降35.4%
作者：机器之心发布日期：2026-04-26 11:49:15
在过去一年中，大模型推理中的「过度思考」问题引发了广泛关注。然而，真正的挑战并非简单地缩短思维链。面对简单问题，模型往往在得出正确答案后仍持续进行冗余验证；而许多旨在抑制过度思考的方法虽能压缩输出长度
阅读全文
开源模型横扫21个科学发现任务！宽德Will联手斯坦福清北，把试错变成武器
作者：机器之心发布日期：2026-04-25 14:08:57
编辑｜Sia不是让模型更聪明，而是让试错本身变得更高效。有了这套框架「傍身」，普通开源模型也能「逆袭」做出惊人科学发现。假设你手里只有一笔有限预算，要去搏一项未知的科学发现。你会怎么选？把钱全砸给一个
阅读全文
ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖
作者：机器之心发布日期：2026-04-25 14:08:57
机器之心编辑部ICLR 2026 获奖论文已经公布。今年共有 2 篇论文获得「杰出论文奖」（Outstanding Paper），另有 1 篇论文获得「荣誉提名」（Honorable Mention）
阅读全文
前馈式3D的终极路线图来了！五大核心战线，一文看清未来三维重建该往哪走
作者：机器之心发布日期：2026-04-25 14:08:57
从单幅图像恢复三维结构，到多视图场景建模、动态 4D 重建，再到机器人、自动驾驶、SLAM 与视频生成，如何让模型在不依赖逐场景优化的前提下，直接、高效地理解并重建三维世界，正在成为 3D 视觉领域的
阅读全文
机器人马拉松超越人类之后：本体走到尽头，智能成为下半场
作者：机器之心发布日期：2026-04-24 17:00:00
机器之心发布近日，人形机器人第一次在真正意义上，“超越” 了人类。2026 北京亦庄人形机器人半程马拉松赛上，荣耀人形机器人 “闪电” 凭借 50 分 26 秒（净用时）的成绩，获得此次比赛冠军，并大
阅读全文
Anthropic实锤Claude Code「降智」：就是这三个Bug造成的
作者：机器之心发布日期：2026-04-24 17:00:00
机器之心编辑部今天 AI 圈好不热闹，先是 OpenAI 声势浩大发布 GPT5.5，接着是盼了又盼的 DeepSeek v4 终于发布。而就在这狂欢的夹缝中，Anthropic 也在「搞事情」，不过
阅读全文
记得住、答得快、用得省：HERMES 让流式视频理解实时响应提速10倍
作者：机器之心发布日期：2026-04-24 17:00:00
复旦大学、上海创智学院与新加坡国立大学联合提出 HERMES，一个面向流式视频理解的免训练 (training-free) 框架。它将 KV Cache 重新建模为层次化记忆系统，在用户提问到来时无需
阅读全文
姚顺雨带队、Hy3 preview上线！腾讯现在适合上车吗？
作者：机器之心发布日期：2026-04-23 19:08:09
编辑｜吴昕刚刚，腾讯混元 Hy3 Preview 正式亮相。这是姚顺雨归国加盟腾讯后交出的第一份重磅答卷，整体性能达到了同尺寸模型最佳水平，兼具实用性和性价比。看似慢一拍的动作，正好回应了前不久的那个
阅读全文
刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2
作者：机器之心发布日期：2026-04-23 19:08:09
机器之心编辑部就在刚刚，DeepSeek 的 GitHub 开始了频繁更新，上线开源了一个新的代码库 Tile Kernels，同时并对 DeepEP 代码库进行了更新，上线了 DeepEP V2。距
阅读全文
首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析
作者：机器之心发布日期：2026-04-23 19:08:09
几乎所有 Transformer 都在做一件反常的事：把大量注意力集中到少数几个特定 Token 上。这不是 bug，而是 Transformer 固有的「注意力汇聚」（Attention Sink）
阅读全文
千万养虾人的终极梦想！全球首个「养虾本」带你懒人养虾开箱即食
作者：机器之心发布日期：2026-04-22 11:30:00
编辑｜冷猫养虾的风还是吹到了硬件上。前些天，我们受邀参加了荣耀的技术沟通会，没想到在会场门口就被一个吸睛的「龙虾」应用勾走了魂：（不是这个，擦擦口水……）主角是下面这位：这个 3D 打印背后大有乾坤—
阅读全文
Transformer可以改装成Mamba了：苹果把推理成本直接打成线性
作者：机器之心发布日期：2026-04-22 11:30:00
编辑｜Sia最近，苹果又整了个活儿，很工程、也挺关键：把又贵又强的 Transformer，改造成又便宜又差不多强的 Mamba。而且，性能基本没怎么掉。听起来炸不炸？有点像水电煤级别的升级。为啥要折
阅读全文