机器之心

刚刚，智源悟界·Emu3.5登场，原生具备世界建模能力
作者：机器之心发布日期：2025-10-30 16:49:26
机器之心发布机器之心编辑部当业界还在为自回归与扩散这两种主流技术路线孰优孰劣而激辩时，答案可能已经显现。今天，北京智源人工智能研究院（BAAI）重磅发布了其多模态系列模型的最新力作 —— 悟界・Emu
阅读全文
扩散语言模型新发现：其计算潜力正在被浪费？
作者：机器之心发布日期：2025-10-30 16:49:26
机器之心报道机器之心编辑部按从左到右的顺序依次生成下一个 token 真的是大模型生成方式的最优解吗？最近，越来越多的研究者对此提出质疑。其中，有些研究者已经转向一个新的方向 —— 掩码扩散语言模型（
阅读全文
世界模型可单GPU秒级生成了？腾讯开源FlashWorld，效果惊艳、免费体验
作者：机器之心发布日期：2025-10-30 16:49:26
厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注，在当日 Huggingfa
阅读全文
人大、清华DeepAnalyze，让LLM化身数据科学家
作者：机器之心发布日期：2025-10-30 16:49:26
来自人大和清华的研究团队发布了 DeepAnalyze，首个面向自主数据科学的 agentic LLM。DeepAnalyze引起了社区内广泛讨论，一周内收获1000多个GitHub星标、20w余次社
阅读全文
吴恩达关注的Ling-1T背后，蚂蚁Ling 2.0技术报告解密万亿模型开源配方
作者：机器之心发布日期：2025-10-29 15:19:55
机器之心报道编辑：PandaAI 导师吴恩达在其最新一期的 The Batch Newsletter 中，将目光投向了来自蚂蚁集团的最新开源模型 Ling-1T。吴恩达 The Batch Newsl
阅读全文
近500页史上最全扩散模型修炼宝典，宋飏等人一书覆盖三大主流视角
作者：机器之心发布日期：2025-10-29 15:19:55
机器之心报道编辑：冷猫、陈陈关于扩散模型的一切，宋飏等人写成了 460 多页的书。扩散模型（Diffusion Models），几乎重塑了整个生成式 AI 的版图。从图像到音频，从视频到 3D 世界
阅读全文
用「传心术」替代「对话」，清华大学联合无问芯穹、港中文等机构提出Cache-to-Cache模型通信新范式
作者：机器之心发布日期：2025-10-29 15:19:55
随着大语言模型的快速进步，为了适应越来越多样的工作场景，模型越来越多在指定场景进行针对性训练，例如代码、数学计算、视觉理解、边缘计算等。而在面对复杂任务与特定场景时，通过多智能体进行探索、决策、信息交
阅读全文
ICCV25 Highlight｜格灵深瞳RICE模型狂刷榜单，让AI「看懂」图片的每个细节
作者：机器之心发布日期：2025-10-29 15:19:55
最近，格灵深瞳公司灵感团队自研的视觉模型基座RICE（MVT v1.5）再次惊艳全场，刷榜多项视觉任务。RICE 作为 MVT 系列的新模型，继续延续前作 Unicom（MVT v1.0）和 MLCD
阅读全文
AI不再「炫技」，淘宝要让技术解决用户每一个具体问题
作者：机器之心发布日期：2025-10-28 12:29:01
机器之心报道编辑：Youli2003 年，美国哈佛商学院教授克莱顿・克里斯坦森在《创新者的解答》中提出这样一个观点：颠覆性创新常常通过让复杂的产品或服务变得更简单、更便宜、更易用，从而让更多的人能够参
阅读全文
AI算力饥渴和高能耗困局谁来解？两位95后创始人用相变材料光计算构建新范式
作者：机器之心发布日期：2025-10-28 12:29:01
机器之心发布机器之心编辑部光本位两位联合创始人，左为熊胤江、右为程唐盛数字化浪潮重塑全球产业格局的进程中，人工智能应用的爆发式增长正以前所未有的力度重构生产力边界，而算力作为支撑这一变革的核心基础设施
阅读全文
AlphaGo之父找到创造强化学习算法新方法：让AI自己设计
作者：机器之心发布日期：2025-10-28 12:29:01
机器之心报道编辑：+0、Panda强化学习是近来 AI 领域最热门的话题之一，新算法也在不断涌现。那么，问题来了：AI 能不能自己发现强大的强化学习算法呢？近日，谷歌 DeepMind 团队在 Nat
阅读全文
3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B
作者：机器之心发布日期：2025-10-28 12:29:01
邢龙和董潇逸为本篇文章共同第一作者。邢龙是中国科学技术大学博士生，师从林达华教授和吴枫教授，研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。董潇逸是香港中文大学 M
阅读全文
Efficiency Law, 物理精确世界模型，及世界模型引擎驱动的具身智能学习新范式
作者：机器之心发布日期：2025-10-27 13:21:17
机器之心发布机器之心编辑部2025 年秋的具身智能赛道正被巨头动态点燃：特斯拉上海超级工厂宣布 Optimus 2.0 量产下线，同步开放开发者平台提供运动控制与环境感知 SDK，试图通过生态共建破解
阅读全文
DeepSeek最会讨好，LLM太懂人情世故了，超人类50%
作者：机器之心发布日期：2025-10-27 13:21:17
机器之心报道机器之心编辑部用过大模型的都知道，它们多多少少存在一些迎合人类的行为，但万万没想到，AI 模型的迎合性比人类高出 50%。在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11
阅读全文
推理效率狂飙60倍：DiDi-Instruct让扩散大模型16步超越千步GPT
作者：机器之心发布日期：2025-10-27 13:21:17
近日，来自普渡大学、德克萨斯大学、新加坡国立大学、摩根士丹利机器学习研究、小红书 hi-lab 的研究者联合提出了一种对离散扩散大语言模型的后训练方法 —— Discrete Diffusion Di
阅读全文
TPAMI 2025 | AI对抗迁移性评估的「拨乱反正」：那些年效果虚高的攻防算法们
作者：机器之心发布日期：2025-10-27 13:21:17
本文第一作者 / 通讯作者赵正宇来自西安交通大学，共同第一作者张焓韡、李仞珏分别来自德国萨尔大学、中科工业人工智能研究院。其他合作者分别来自法国马赛中央理工、法国 INRIA 国家信息与自动化研究所、
阅读全文
连马桶都会看图说话了，巨头敢卖，你敢坐么？
作者：机器之心发布日期：2025-10-26 12:01:42
机器之心原创编辑：Sia屎屁尿也是宝贵数据，卫浴巨头把AI放进厕所，看好「被动式、零交互」的健康场景。据说，日本人来香港买楼，有一条隐形标配：TOTO 智能马桶，必不可少。加热座圈、温柔清洗、播放自然
阅读全文
打造图像编辑领域的ImageNet？苹果用Nano Banana开源了一个超大数据集
作者：机器之心发布日期：2025-10-26 12:01:42
机器之心报道编辑：冷猫苹果在大模型和大模型应用上总是慢人一步。Apple Intelligence 发布也已经一年多了，除去其仍未能在国行设备上提供服务外，功能上也很难称得上有多好用。就拿视觉生成类功
阅读全文
NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍
作者：机器之心发布日期：2025-10-26 12:01:42
自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持
阅读全文
深度拆解，硬核解构，揭开vLLM推理系统实现高效吞吐的秘籍
作者：机器之心发布日期：2025-10-26 12:01:42
选自Aleksa Gordic博客机器之心编译编辑：冷猫在大模型应用快速发展的今天，如何让推理变得更快、更高效，已经成为研究和产业界共同关注的焦点。vLLM 便是在这样的背景下诞生的一套高性能推理框架
阅读全文
Yoshua Bengio，刚刚成为全球首个百万引用学者！
作者：机器之心发布日期：2025-10-25 12:23:19
机器之心报道编辑：Panda刚刚，计算机科学家 Yoshua Bengio 创造了新的历史，成为 Google Scholar 上首个引用量超过 100 万的人！打个直观的比方，如果我们将每一篇引用论
阅读全文
Anthropic、Thinking Machines Lab论文曝光：30万次压力测试揭示AI规范缺陷
作者：机器之心发布日期：2025-10-25 12:23:19
机器之心报道机器之心编辑部即便是最详细的模型规范，也存在内部矛盾、粒度不足与解释歧义。现如今，LLM 正越来越多地受到模型规范的约束，这些规范为模型的行为准则与伦理边界提供了清晰定义。它们构成了 Co
阅读全文
让机器人「不仅会想，还能准确去做」，VLA-R1把「推理+行动」带进真实世界
作者：机器之心发布日期：2025-10-25 12:23:19
在机器人与智能体领域，一个老大难问题是：当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时，它不仅要看懂环境，更要解释指令、规划路径 / 可操作区域，并把这些推理落实
阅读全文
NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻
作者：机器之心发布日期：2025-10-25 12:23:19
作者为北京航空航天大学的肖宜松，刘艾杉，应宗浩，刘祥龙，新加坡国立大学的梁思源，新加坡南洋理工大学的陶大程。本文已被 NeurIPS 2025 录用。LLM 已在智能创作、企业服务等领域广泛应用，但其
阅读全文
死磕「文本智能」，多模态研究的下一个前沿
作者：机器之心发布日期：2025-10-24 14:23:25
机器之心原创作者：张倩前段时间，我们报道过一个非常有趣的现象 —— 在求医问药这件事上，越来越多的人开始求助于 AI 了，尤其是在病因难以明确的情况下。有人甚至声称 AI 帮自己分析出了求医十年都未查
阅读全文
Meta裁员后续：田渊栋被过河拆桥，姚顺雨等集体「抢人」
作者：机器之心发布日期：2025-10-24 14:23:25
机器之心报道编辑：冷猫、+0Meta 裁员余波渐起。昨天的消息，Meta 已在其人工智能部门裁减约 600 个职位，调整波及 FAIR、AI 产品以及基础设施团队。最令人震惊的是田渊栋团队都被 Ale
阅读全文
Seedream 4.0大战Nano Banana、GPT-4o？EdiVal-Agent 终结图像编辑评测
作者：机器之心发布日期：2025-10-24 14:23:25
在 AIGC 的下一个阶段，图像编辑（Image Editing）正逐渐取代一次性生成，成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型？为了解决这一难题，
阅读全文
谷歌最强AI，被港科大开源超了？让海外创作者喊出「King Bomb」的P图大杀器来了
作者：机器之心发布日期：2025-10-23 13:07:01
机器之心原创编辑：杜伟「Photoshop is dead」，已经成为最近 AI 创作者圈中讨论最热的话题之一。随着图像编辑与生成模型进入到了又一个集中爆发期，这个专业创意软件长久以来的王座地位受到了
阅读全文
10个视频9个看走眼：连真视频都打Sora水印碰瓷，这世界还能信啥？
作者：机器之心发布日期：2025-10-23 13:07:01
机器之心报道编辑：杨文AI 检测准确率高达 98.9%，也防不住有人给真视频 P 上 Sora 水印。前段时间刷到一个视频，标题就是「中俄混血女明星回应地下室打婆婆传闻」，试问谁看了这个标题能不燃起熊
阅读全文
无VAE扩散模型！清华&可灵团队「撞车」谢赛宁团队「RAE」
作者：机器之心发布日期：2025-10-23 13:07:01
长期以来，扩散模型的训练通常依赖由变分自编码器（VAE）构建的低维潜空间表示。然而，VAE 的潜空间表征能力有限，难以有效支撑感知理解等核心视觉任务，同时「VAE + Diffusion」的范式在训练
阅读全文