全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AI能否「圣地巡礼」?多模态大模型全新评估基准VIR-Bench来了

    作者:机器之心发布日期:2025-10-15 12:04:23

    大家或许都有过这样的体验:看完一部喜欢的动漫,总会心血来潮地想去 “圣地巡礼”;刷到别人剪辑精美的旅行 vlog,也会忍不住收藏起来,想着哪天亲自走一遍同样的路线。旅行与影像的结合,总是能勾起人们的探

    阅读全文
  • 文章封面

    蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

    作者:机器之心发布日期:2025-10-14 13:42:23

    机器之心原创作者:吴昕、杨文Ring-1T 已成长为可与闭源巨头正面对话的选手,也是开源体系下闭源级性能的又一次实证。蚂蚁,又双叒叕开源万亿大模型了!短短十余天,接连三弹。10 月 9 日凌晨,蚂蚁官

    阅读全文
  • 文章封面

    OpenAI、Anthropic、DeepMind联手发文:现有LLM安全防御不堪一击

    作者:机器之心发布日期:2025-10-14 13:42:23

    机器之心报道编辑:+0、陈陈本文实测 12 种防御方法,几乎全军覆没。真是罕见,OpenAI、Anthropic、Google DeepMind 这三大竞争对手,居然联手发表了一篇论文,共同研究语言模

    阅读全文
  • 文章封面

    斯坦福、英伟达和伯克利提出具身Test-Time Scaling Law

    作者:机器之心发布日期:2025-10-14 13:42:23

    本文的第一作者为斯坦福大学博士生 Jacky Kwok。共同通讯作者包括英伟达自动驾驶研究总监 Marco Pavone、斯坦福大学计算机系教授兼 DeepMind 科学家 Azalia Mirhos

    阅读全文
  • 文章封面

    景不动人动,MLLM如何面对「移步换景」的真实世界?OST-Bench揭示多模态大模型在线时空理解短板

    作者:机器之心发布日期:2025-10-14 13:42:23

    多模态大语言模型(MLLMs)已在视觉与语言模态融合的感知与推理任务中展现出强大能力。而上海人工智能实验室、上海交通大学、香港大学、香港中文大学的研究者们提出的的 OST-Bench, 则是从智能体探

    阅读全文
  • 文章封面

    ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」

    作者:机器之心发布日期:2025-10-13 12:18:15

    机器之心报道机器之心编辑部说出概念,SAM 3 就明白你在说什么,并在所有出现的位置精确描绘出边界。Meta 的「分割一切」再上新?9 月 12 日,一篇匿名论文「SAM 3: SEGMENT ANY

    阅读全文
  • 文章封面

    大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金

    作者:机器之心发布日期:2025-10-13 12:18:15

    机器之心报道编辑:冷猫人工智能真是日新月异。早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获

    阅读全文
  • 文章封面

    为MoE解绑:全新「专家即服务」推理架构发布,超细粒度扩展锐减37.5%成本

    作者:机器之心发布日期:2025-10-13 12:18:15

    本文第一作者刘子铭为新加坡国立大学三年级博士生,本科毕业于北京大学,研究方向为机器学习系统中的并行推理与训练效率优化。通信作者为上海创智学院冯思远老师和新加坡国立大学尤洋老师。共同作者来自于上海奇绩智

    阅读全文
  • 文章封面

    NeurIPS 2025 Spotlight | GeoSVR:稀疏体素的新潜力——超越3DGS系列的高精度三维表面重建

    作者:机器之心发布日期:2025-10-13 12:18:15

    在计算机视觉与图形学中,表面重建是一个长期未解的难题:给定一组多视角图像,能否重建出高精度、几何清晰、细节丰富的 3D 模型?近年来,NeRF、SDF 与 3D Gaussian Splatting

    阅读全文
  • 文章封面

    硅谷CEO们高喊AI威胁论,「5年内失业率飙升至20%」,但95%AI项目赔本赚吆喝

    作者:机器之心发布日期:2025-10-12 12:00:00

    机器之心报道编辑:杨文当前「AI 威胁就业」的论调,更多是基于技术趋势的预警,而非基于现实的既成事实,但这也绝非轻视 AI 长期影响的理由。最近,「AI 让人类失业」的论调甚嚣尘上,给本就焦虑的打工人

    阅读全文
  • 文章封面

    Qwen3 变身扩散语言模型?不从零训练也能跑,30B参数创纪录

    作者:机器之心发布日期:2025-10-12 12:00:00

    机器之心报道编辑:张倩扩散语言模型(Diffusion Language Models,DLM)一直以来都令研究者颇感兴趣,因为与必须按从左到右顺序生成的自回归模型(Autoregressive, A

    阅读全文
  • 文章封面

    LLM越狱攻击的威胁被系统性高估? 基于分解式评分的「越狱评估新范式」出炉

    作者:机器之心发布日期:2025-10-12 12:00:00

    JADES 由德国亥姆霍兹信息安全中心 (CISPA),富莱睿(Flexera)和西安交通大学的研究团队合作完成。本文的通讯作者为 CISPA 教授张阳。引言回想一下,老师会如何批改考试中的开放题:如

    阅读全文
  • 文章封面

    首家AIOS落地来自vivo:个人化智能复刻人类思维,手机还能这样用

    作者:机器之心发布日期:2025-10-11 12:15:29

    机器之心报道编辑:泽南真正实用化的生成式 AI,应该是这个样子 ——作为助手可以帮你代打电话,根据你的选项进行应答,还能引导对方转人工:功能覆盖多个场景,连接大量第三方应用,实现多智能体的一键协同:拍

    阅读全文
  • 文章封面

    陶哲轩:用了GPT-5 Pro后,小尺度、宏观尺度很赞,中尺度有点垮

    作者:机器之心发布日期:2025-10-11 12:15:29

    机器之心报道机器之心编辑部说起对 AI 的使用,著名数学家陶哲轩可谓是最具代表性的一位。这位菲尔兹奖得主,不仅在数学领域不断拓展边界,如今也积极尝试与 AI 协作,探索人工智能在数学研究中的真正潜力。

    阅读全文
  • 文章封面

    读万卷书,大模型就能「看」懂视觉世界?Meta揭秘LLM视觉先验的起源

    作者:机器之心发布日期:2025-10-11 12:15:29

    一个只见过文本的大语言模型(LLM),在从未直接看过图像的情况下,竟然能学到可迁移到视觉任务的先验能力 —— 这是 Meta Superintelligence Labs 与牛津团队新论文的发现。近日

    阅读全文
  • 文章封面

    管你模型多大,250份有毒文档统统放倒,Anthropic:LLM比想象中脆弱

    作者:机器之心发布日期:2025-10-10 11:44:27

    机器之心报道编辑:冷猫、张倩黑掉一个大模型似乎比人们预期的要简单得多?在传统观点中,要想攻击或是污染一个具有庞大参数量的大模型是一件非常困难的事。从训练数据入手攻击是一个常见的思路,普遍观念认为需要极

    阅读全文
  • 文章封面

    刚刚,Figure 03人形机器人登场,能感知一枚回形针重量

    作者:机器之心发布日期:2025-10-10 11:44:27

    机器之心报道机器之心编辑部Figure 03为走入家庭和规模化量产而来。一间屋子里,一个机器人忙个不停。给人端茶倒水、俯身收拾垃圾,转身清洗餐具,又熟练地将衣物洗净、折叠、归类,可以说是包揽一切家务活

    阅读全文
  • 文章封面

    协同加速,多机器人协作不再「慢半拍」!软硬一体化框架ReCA破解具身智能落地效率瓶颈

    作者:机器之心发布日期:2025-10-10 11:44:27

    从仓库里的物流机器人到科幻电影中的「贾维斯」,我们对智能机器人的想象从未停止。学术界在模拟器里实现了越来越复杂的协作任务,工业界也让机器人学会了韦伯斯特空翻。然而,一个残酷的现实是:当下的机器「人」更

    阅读全文
  • 文章封面

    更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA

    作者:机器之心发布日期:2025-10-09 10:20:44

    机器之心原创作者:吴昕Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。规模、速度与推理精度,其实可以兼顾。完全测不过来了。仅仅一个 9 月,全球就有十余家主流玩

    阅读全文
  • 文章封面

    听说,大家都在梭后训练?最佳指南来了

    作者:机器之心发布日期:2025-10-09 10:20:44

    机器之心编译作者:Han Fang、Karthik Abinav Sankararaman机器之心编辑部LLM 后训练最佳入门介绍。在大模型时代,Scaling Law 一度是 AI 领域公认的准则:

    阅读全文
  • 文章封面

    机器人「看片」自学新技能:NovaFlow从生成视频中提取动作流,实现零样本操控

    作者:机器之心发布日期:2025-10-09 10:20:44

    本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。通讯作者付佳慧在 Robotics and AI Ins

    阅读全文
  • 文章封面

    Being-VL的视觉BPE路线:把「看」和「说」真正统一起来

    作者:机器之心发布日期:2025-10-09 10:20:44

    在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就

    阅读全文
  • 文章封面

    重磅|清华物理系传奇姚顺宇离职,不认同Anthropic,加入DeepMind

    作者:机器之心发布日期:2025-10-08 12:09:58

    机器之心报道机器之心编辑部最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。根据姚顺宇在博客上发表的文章得知,他于 9 月

    阅读全文
  • 文章封面

    谷歌大神出手,免费发布《智能体设计模式》,AI Agent开发的终极秘籍

    作者:机器之心发布日期:2025-10-08 12:09:58

    机器之心报道编辑:Panda当前,AI 领域最火热的浪潮无疑是 AI Agent(智能体)。从科技巨头到创业公司,无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。然而,在这股「淘金热

    阅读全文
  • 文章封面

    开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

    作者:机器之心发布日期:2025-10-08 12:09:58

    机器之心报道机器之心编辑部AI 时代,智能体对短期对话的处理能力已不再是难题。真正的挑战是让智能体在数百步的探索中依然保持清晰的推理与稳健的决策。传统的强化学习框架在几十步内尚能应付,但一旦任务延展至

    阅读全文
  • 文章封面

    刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API

    作者:机器之心发布日期:2025-10-07 08:07:09

    机器之心报道编辑:PandaOpenAI 今年的开发者大会(OpenAI DevDay 2025)正在进行中。Keynote 一开场,山姆・奥特曼便分享了 OpenAI 这两年取得的成绩:400 万开

    阅读全文
  • 文章封面

    清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

    作者:机器之心发布日期:2025-10-07 08:07:09

    清华大学朱军教授团队, NVIDIA Deep Imagination 研究组与斯坦福 Stefano Ermon 团队联合提出了一种全新的扩散模型强化学习(RL)范式 ——Diffusion Neg

    阅读全文
  • 文章封面

    苹果再发论文:精准定位LLM幻觉,GPT-5、o3都办不到

    作者:机器之心发布日期:2025-10-06 11:56:31

    机器之心报道机器之心编辑部苹果这几天真是进入了论文高产期,时不时就有新的研究发布出来。就在近日,苹果又发布了一篇引发学界与业界关注的重磅论文。这篇论文非常有意思,它用强化学习训练模型,让模型能够准确标

    阅读全文
  • 文章封面

    多个编码智能体同时使用会不会混乱?海外开发者热议

    作者:机器之心发布日期:2025-10-06 11:56:31

    机器之心报道编辑:冷猫AI 编程工具的进步速度正在迅速加快。如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已

    阅读全文
  • 文章封面

    EMNLP 2025 | CARE:无需外部工具,让大模型原生检索增强推理实现上下文高保真

    作者:机器之心发布日期:2025-10-06 11:56:31

    近日,来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架,一个新颖的原生检索增强推理框架,教会 LLM 将推理过程中的上下文事实与模型自身

    阅读全文
上一页下一页