AI能否「圣地巡礼」?多模态大模型全新评估基准VIR-Bench来了
大家或许都有过这样的体验:看完一部喜欢的动漫,总会心血来潮地想去 “圣地巡礼”;刷到别人剪辑精美的旅行 vlog,也会忍不住收藏起来,想着哪天亲自走一遍同样的路线。旅行与影像的结合,总是能勾起人们的探
阅读全文大家或许都有过这样的体验:看完一部喜欢的动漫,总会心血来潮地想去 “圣地巡礼”;刷到别人剪辑精美的旅行 vlog,也会忍不住收藏起来,想着哪天亲自走一遍同样的路线。旅行与影像的结合,总是能勾起人们的探
阅读全文机器之心原创作者:吴昕、杨文Ring-1T 已成长为可与闭源巨头正面对话的选手,也是开源体系下闭源级性能的又一次实证。蚂蚁,又双叒叕开源万亿大模型了!短短十余天,接连三弹。10 月 9 日凌晨,蚂蚁官
阅读全文机器之心报道编辑:+0、陈陈本文实测 12 种防御方法,几乎全军覆没。真是罕见,OpenAI、Anthropic、Google DeepMind 这三大竞争对手,居然联手发表了一篇论文,共同研究语言模
阅读全文本文的第一作者为斯坦福大学博士生 Jacky Kwok。共同通讯作者包括英伟达自动驾驶研究总监 Marco Pavone、斯坦福大学计算机系教授兼 DeepMind 科学家 Azalia Mirhos
阅读全文多模态大语言模型(MLLMs)已在视觉与语言模态融合的感知与推理任务中展现出强大能力。而上海人工智能实验室、上海交通大学、香港大学、香港中文大学的研究者们提出的的 OST-Bench, 则是从智能体探
阅读全文机器之心报道机器之心编辑部说出概念,SAM 3 就明白你在说什么,并在所有出现的位置精确描绘出边界。Meta 的「分割一切」再上新?9 月 12 日,一篇匿名论文「SAM 3: SEGMENT ANY
阅读全文机器之心报道编辑:冷猫人工智能真是日新月异。早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获
阅读全文本文第一作者刘子铭为新加坡国立大学三年级博士生,本科毕业于北京大学,研究方向为机器学习系统中的并行推理与训练效率优化。通信作者为上海创智学院冯思远老师和新加坡国立大学尤洋老师。共同作者来自于上海奇绩智
阅读全文在计算机视觉与图形学中,表面重建是一个长期未解的难题:给定一组多视角图像,能否重建出高精度、几何清晰、细节丰富的 3D 模型?近年来,NeRF、SDF 与 3D Gaussian Splatting
阅读全文机器之心报道编辑:杨文当前「AI 威胁就业」的论调,更多是基于技术趋势的预警,而非基于现实的既成事实,但这也绝非轻视 AI 长期影响的理由。最近,「AI 让人类失业」的论调甚嚣尘上,给本就焦虑的打工人
阅读全文机器之心报道编辑:张倩扩散语言模型(Diffusion Language Models,DLM)一直以来都令研究者颇感兴趣,因为与必须按从左到右顺序生成的自回归模型(Autoregressive, A
阅读全文JADES 由德国亥姆霍兹信息安全中心 (CISPA),富莱睿(Flexera)和西安交通大学的研究团队合作完成。本文的通讯作者为 CISPA 教授张阳。引言回想一下,老师会如何批改考试中的开放题:如
阅读全文机器之心报道编辑:泽南真正实用化的生成式 AI,应该是这个样子 ——作为助手可以帮你代打电话,根据你的选项进行应答,还能引导对方转人工:功能覆盖多个场景,连接大量第三方应用,实现多智能体的一键协同:拍
阅读全文机器之心报道机器之心编辑部说起对 AI 的使用,著名数学家陶哲轩可谓是最具代表性的一位。这位菲尔兹奖得主,不仅在数学领域不断拓展边界,如今也积极尝试与 AI 协作,探索人工智能在数学研究中的真正潜力。
阅读全文一个只见过文本的大语言模型(LLM),在从未直接看过图像的情况下,竟然能学到可迁移到视觉任务的先验能力 —— 这是 Meta Superintelligence Labs 与牛津团队新论文的发现。近日
阅读全文机器之心报道编辑:冷猫、张倩黑掉一个大模型似乎比人们预期的要简单得多?在传统观点中,要想攻击或是污染一个具有庞大参数量的大模型是一件非常困难的事。从训练数据入手攻击是一个常见的思路,普遍观念认为需要极
阅读全文机器之心报道机器之心编辑部Figure 03为走入家庭和规模化量产而来。一间屋子里,一个机器人忙个不停。给人端茶倒水、俯身收拾垃圾,转身清洗餐具,又熟练地将衣物洗净、折叠、归类,可以说是包揽一切家务活
阅读全文从仓库里的物流机器人到科幻电影中的「贾维斯」,我们对智能机器人的想象从未停止。学术界在模拟器里实现了越来越复杂的协作任务,工业界也让机器人学会了韦伯斯特空翻。然而,一个残酷的现实是:当下的机器「人」更
阅读全文机器之心原创作者:吴昕Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。规模、速度与推理精度,其实可以兼顾。完全测不过来了。仅仅一个 9 月,全球就有十余家主流玩
阅读全文机器之心编译作者:Han Fang、Karthik Abinav Sankararaman机器之心编辑部LLM 后训练最佳入门介绍。在大模型时代,Scaling Law 一度是 AI 领域公认的准则:
阅读全文本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。通讯作者付佳慧在 Robotics and AI Ins
阅读全文在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就
阅读全文机器之心报道机器之心编辑部最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。根据姚顺宇在博客上发表的文章得知,他于 9 月
阅读全文机器之心报道编辑:Panda当前,AI 领域最火热的浪潮无疑是 AI Agent(智能体)。从科技巨头到创业公司,无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。然而,在这股「淘金热
阅读全文机器之心报道机器之心编辑部AI 时代,智能体对短期对话的处理能力已不再是难题。真正的挑战是让智能体在数百步的探索中依然保持清晰的推理与稳健的决策。传统的强化学习框架在几十步内尚能应付,但一旦任务延展至
阅读全文机器之心报道编辑:PandaOpenAI 今年的开发者大会(OpenAI DevDay 2025)正在进行中。Keynote 一开场,山姆・奥特曼便分享了 OpenAI 这两年取得的成绩:400 万开
阅读全文清华大学朱军教授团队, NVIDIA Deep Imagination 研究组与斯坦福 Stefano Ermon 团队联合提出了一种全新的扩散模型强化学习(RL)范式 ——Diffusion Neg
阅读全文机器之心报道机器之心编辑部苹果这几天真是进入了论文高产期,时不时就有新的研究发布出来。就在近日,苹果又发布了一篇引发学界与业界关注的重磅论文。这篇论文非常有意思,它用强化学习训练模型,让模型能够准确标
阅读全文机器之心报道编辑:冷猫AI 编程工具的进步速度正在迅速加快。如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已
阅读全文近日,来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架,一个新颖的原生检索增强推理框架,教会 LLM 将推理过程中的上下文事实与模型自身
阅读全文