机器之心

玩到崩溃，《青椒模拟器》游戏爆火，我在AI世界一路升级做院士
作者：机器之心发布日期：2025-12-20 12:42:32
机器之心编辑部「出门在外，身份都是自己给的」。最近两天，一款名为《青椒模拟器》的小游戏突然火了，好玩程度一整个把人震撼住了。游戏时间以学年为单位推进。一开始，每个人的起点都差不多：职称未定、资源有限、
阅读全文
Anthropic公布新技术：不靠删数据，参数隔离移除AI危险
作者：机器之心发布日期：2025-12-20 12:42:32
机器之心编辑部近年来，大语言模型的能力突飞猛进，但随之而来的却是愈发棘手的双重用途风险（dual-use risks）。当模型在海量公开互联网数据中学习时，它不仅掌握语言与推理能力，也不可避免地接触到
阅读全文
布局控制+身份一致：浙大提出ContextGen，实现布局锚定多实例生成新SOTA
作者：机器之心发布日期：2025-12-20 12:42:32
随着扩散模型（Diffusion Models）的迭代演进，图像生成已经日臻成熟。然而，在多实例图像生成（Multi-Instance Image Generation, MIG）这一有着大量用户
阅读全文
拆解CANN：当华为决定打开算力的「黑盒」
作者：机器之心发布日期：2025-12-19 14:37:17
编辑｜Panda、泽南大模型的竞争如火如荼，也有一群人正在研究如何降低门槛，让 AI 工具变得亲民。最近，在 AI 基础算力上重磅频出的华为，又亮出了一张王牌：昇腾的底层基础软件，CANN 全面开源开
阅读全文
Mamba作者团队提出SonicMoE：一个Token舍入，让MoE训练速度提升近2倍
作者：机器之心发布日期：2025-12-19 14:37:17
机器之心编辑部混合专家（MoE）模型已成为在不显著增加计算成本的情况下，实现语言模型规模化扩展的事实标准架构。近期 MoE 模型展现出明显的高专家粒度（更小的专家中间层维度）和高稀疏性（在专家总数增加
阅读全文
大模型「越想越错」？人大&腾讯团队用信息论揭示：什么时候该想、什么时候别想
作者：机器之心发布日期：2025-12-19 14:37:17
本文的第一作者雍希贤是来中国人民大学的博士生，研究方向聚焦于 Humanoid AI，LLM Coginition & Reasoning。通讯作者为中国人民大学的周骁副教授以及腾讯天衍实验室的吴贤。
阅读全文
不卖「工具」卖「生产力」，百融云创如何用「硅基员工」打破AI落地僵局？
作者：机器之心发布日期：2025-12-18 18:12:08
编辑｜Youli年初，围绕着 2025 年将是「大模型落地应用元年」「AI Agent 元年」的共识，业界开始了大规模持续探索。如今临近年尾，回过头来看，从高度标准化的客服对话、代码生成到流程化文档处
阅读全文
与Physical Intelligence同日发声：深度机智亮出「情境数采」杀手锏，具身智能的通用性天花板要被捅破了？
作者：机器之心发布日期：2025-12-18 18:12:08
机器之心发布具身智能通往通用性的征途，正被 “数据荒漠” 所阻隔。当模型在模拟器中刷出高分，却在现实复杂场景中频频 “炸机” 时，行业开始反思：我们喂给机器人的数据，是否真的包含人类操作的精髓？近日，
阅读全文
SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人
作者：机器之心发布日期：2025-12-18 18:12:08
在计算机图形学、三维视觉、虚拟人、XR 领域，SIGGRAPH 是毫无争议的 “天花板级会议”。 SIGGRAPH Asia 作为 SIGGRAPH 系列两大主会之一，每年只接收全球最顶尖研究团队的成
阅读全文
硬刚Sora2，万相2.6轻松定制角色、控制分镜，普通人也能当导演
作者：机器之心发布日期：2025-12-17 13:26:16
编辑｜+02025 年即将画上句号，回望这一年的视频生成领域，用「突飞猛进」来形容毫不为过，甚至可以说，视频内容创作的范式正在悄然发生改变。9 月，OpenAI 发布的 Sora 2 凭借「客串（Ca
阅读全文
SIGGRAPH Asia 2025：摩尔线程赢图形顶会3DGS挑战赛大奖，自研LiteGS全面开源
作者：机器之心发布日期：2025-12-17 13:26:16
机器之心发布12 月 17 日，在香港举办的全球图形学领域备受瞩目的顶级学术盛会 SIGGRAPH Asia 2025 上，摩尔线程在 3D Gaussian Splatting Reconstruc
阅读全文
WAIC Future Tech 2026：全球科技曝光+合作，资本的下一个掘金点
作者：机器之心发布日期：2025-12-17 13:26:16
阅读全文
经验记忆黑科技：LightSearcher让AI工具调用减39.6%、推理快48.6%
作者：机器之心发布日期：2025-12-17 13:26:16
如今，以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务，而DeepSearch 作为深度思考大模型的核心搜索器，在推理过程中通过迭代调用外部搜索工具，访问参数边界之外的最新、领
阅读全文
阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集
作者：机器之心发布日期：2025-12-16 12:08:19
机器之心发布如果把用户在互联网上留下的每一个足迹都看作一段记忆，那么现在的推荐系统大多患有 “短期健忘症”。受限于算力和存储，那些沉睡在数年前的点击、收藏与购买，往往被粗暴地截断或遗忘。即便被召回，它
阅读全文
临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统
作者：机器之心发布日期：2025-12-16 12:08:19
机器之心发布通用大模型（LLM）的狂飙突进，终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE（美国执业医师资格考试）中表现优异，但在面对需要「火眼金睛」和「毫厘必争」
阅读全文
56倍加速生成式策略：西交大提出EfficientFlow，迈向高效具身智能
作者：机器之心发布日期：2025-12-16 12:08:19
本文共同第一作者为西安交通大学硕士生常建磊和博士生梅若风。柯炜为西安交通大学副教授。论文通讯作者为西安交通大学教授许翔宇，其研究方向涵盖三维视觉、生成式 AI 与具身智能（个人主页：https://x
阅读全文
国产芯片也能跑AI视频实时生成了，商汤Seko 2.0揭秘幕后黑科技
作者：机器之心发布日期：2025-12-15 16:06:42
机器之心报道编辑：杨文自 Sora 2 发布以来，各大科技厂商迎来新一轮视频生成模型「军备竞赛」，纷纷赶在年底前推出更强的迭代版本。谷歌推出 Veo 3.1，通过首尾帧控制和多图参考解决了以往视频生成
阅读全文
Veo何止生成视频：DeepMind正在用它模拟整个机器人世界
作者：机器之心发布日期：2025-12-15 16:06:42
机器之心报道机器之心编辑部随着通用型（Generalist）机器人策略的发展，机器人能够通过自然语言指令在多种环境中完成各类任务，但这也带来了显著的挑战。一方面，真实世界评估成本极高，需要系统性地覆盖
阅读全文
NeurIPS 2025｜指哪打哪，可控对抗样本生成器来了！
作者：机器之心发布日期：2025-12-15 16:06:42
近日，在全球人工智能领域最具影响力的顶级学术会议 NeurIPS（神经信息处理系统大会）上，清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对抗攻击生成框架。简单来说，Dual-Fl
阅读全文
谷歌创始人布林：当年发完Transformer论文，我们太不当回事了
作者：机器之心发布日期：2025-12-14 12:50:18
机器之心报道机器之心编辑部现在的大学生该选什么专业？未来一百年的大学会是什么样子？业界 AI 如此强势，学界还能做什么？谷歌在过去二十多年里做对了什么，又有哪些遗憾？在斯坦福大学工程学院百年庆典的收官
阅读全文
1100多个模型殊途同归，指向一个「通用子空间」，柏拉图又赢一回？
作者：机器之心发布日期：2025-12-14 12:50:18
机器之心报道编辑：张倩模型架构的重要性可能远超我们之前的认知。最近，约翰斯・霍普金斯大学的一项研究发现：1100 多个不同的神经网络，即使在完全不同的数据集上训练、用不同的初始化和超参数，最终学到的权
阅读全文
SIGGRAPH Asia 2025｜30FPS普通相机恢复200FPS细节，4D重建方案来了
作者：机器之心发布日期：2025-12-14 12:50:18
本文第一作者陈羽田，香港中文大学 MMLab 博士二年级在读，研究方向为三维重建与生成，导师为薛天帆教授。个人主页：https://yutian10.github.io当古装剧中的长袍在武林高手凌空翻
阅读全文
GPT-5.2已上线24小时：差评如潮！
作者：机器之心发布日期：2025-12-13 12:56:03
机器之心报道编辑：杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天，OpenAI 十周年之际，拿出了最新的顶级模型 GPT-5.2 系列，官方号称是「迄今为止在专业
阅读全文
谢赛宁REPA得到大幅改进，只需不到4行代码
作者：机器之心发布日期：2025-12-13 12:56:03
机器之心报道编辑：Panda邹忌曾经有一个问题：吾与徐公孰美？而对于 REPA，也有一个类似的问题：全局信息与空间结构，哪个对表征对齐更重要？表征对齐（REPA）可通过将强大的预训练视觉编码器的表征蒸
阅读全文
AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言
作者：机器之心发布日期：2025-12-13 12:56:03
多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？实际上，不同的语言在模型内部承载着不同的「特长」。比如英语可能逻辑性强，适合科学推
阅读全文
全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔
作者：机器之心发布日期：2025-12-12 11:20:44
机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里，他们介绍了 π0.6 迭代式强化学习的思路来源：其中有我们熟悉的 Yuke Zhu 的研究，也有
阅读全文
Meta「内战」升级：做「神一般的AI」，还是守住「社交帝国」？
作者：机器之心发布日期：2025-12-12 11:20:44
机器之心报道编辑：+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能，公司内部正面临多重挑战。据《纽约时报》报道，Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间，在资源分配、发
阅读全文
NUS LV Lab新作｜FeRA：基于「频域能量」动态路由，打破扩散模型微调的静态瓶颈
作者：机器之心发布日期：2025-12-12 11:20:44
尹博：NUS 计算机工程硕士生、LV Lab 实习生，研究方向是生成式 AI，及参数高效率微调（PEFT）。胡晓彬：NUS LV Lab Senior Research Fellow，研究方向是生成
阅读全文
大模型的第一性原理：（一）统计物理篇
作者：机器之心发布日期：2025-12-11 17:57:09
机器之心发布作者：白铂博士白铂博士，华为 2012 实验室理论研究部主任信息论首席科学家2022 年底，ChatGPT 横空出世，其能力震惊了整个世界。2024 年底，DeepSeek 以极低
阅读全文
何恺明NeurIPS 2025演讲盘点：视觉目标检测三十年
作者：机器之心发布日期：2025-12-11 17:57:09
机器之心报道机器之心编辑部不久前，NeurIPS 2025 顺利举办，作为人工智能学术界的顶级会议之一，其中不乏学术界大佬的工作和演讲。有一项荣誉的颁发显得格外厚重且众望所归 —— 由任少卿、何恺明、
阅读全文