机器之心

字节跳动Seed推出「机器人大脑」Robix：让机器人学会思考、规划与灵活互动
作者：机器之心发布日期：2025-09-07 13:10:24
近日，字节跳动 Seed 团队发布了最新的机器人研究成果——Robix，一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题：Robix: A Unified Model for Robo
阅读全文
OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心报道编辑：PandaAI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。大模型会有幻觉，
阅读全文
00后以1.1亿美金「掀桌」，硅谷AI将书写影视新传奇终结制片旧时代
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心发布机器之心编辑部最年轻的工程师，和团队一起将产品卖给 Fortune 500 的客户，从 0 带到 10。她，22 岁，成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D
阅读全文
任意骨骼系统的模型都能驱动？AnimaX提出基于世界模型的3D动画生成新范式
作者：机器之心发布日期：2025-09-06 11:11:15
本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。本文的第一作者为北京航空航天大学硕士生黄泽桓。本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。在游戏
阅读全文
Nano Banana爆火之后，一个神秘的「胡萝卜」代码模型又上线了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心报道机器之心编辑部以前，每当上线一个新模型，大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说，有时候名字起得太出彩，甚至能把模型本身给卷下去。别人还没搞懂它能干嘛，名字已经在朋友圈刷屏了。不过
阅读全文
沉寂一个月，openPangu性能飙升8%！华为1B开源模型来了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心发布机器之心编辑部在端侧 AI 这个热门赛道，华为盘古大模型扔下了一颗 “重磅炸弹” 。如今，云端大模型已经能侃侃而谈、答疑解惑。但如果这些 AI 大脑能被装进手机、摄像头甚至无人机，会带来怎
阅读全文
多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！
作者：机器之心发布日期：2025-09-05 12:28:02
本系列工作核心作者：郭海洋（自动化所博士生）、朱飞（中科院香港院AI中心AP）、曾繁虎（自动化所硕士生）、刘文卓（自动化所博士生）、赵宏博（自动化所博士生）。通讯作者为自动化所博士生
阅读全文
长视频AI数字人来了！字节×浙大推出商用级音频驱动数字人模型InfinityHuman
作者：机器之心发布日期：2025-09-04 12:07:43
机器之心发布机器之心编辑部随着内容创作智能化需求的爆发，长时长、高质量数字人视频生成始终是行业痛点。近日，字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——In
阅读全文
全奖读AI！人工智能专业排名全球前10的MBZUAI启动本硕博项目招生
作者：机器之心发布日期：2025-09-04 12:07:43
机器之心发布机器之心编辑部在阿联酋 2031 国家人工智能战略的驱动下，穆罕默德・本・扎耶德人工智能大学（MBZUAI）正以 AI 专业学术全球排名前十的硬实力，重塑 AI 教育格局。这所由阿联酋总
阅读全文
SIGCOMM 2025｜重新定义个性化视频体验，快手与清华联合提出灵犀系统
作者：机器之心发布日期：2025-09-04 12:07:43
近日，快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of A
阅读全文
从复刻魔术开始，RoboMirage打开了机器人仿真的新世界
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心发布RoboScience在具身智能的发展路径中，如何获得海量且高质量的数据是行业绕不开的核心问题。如果说大语言模型依赖于互联网规模的语料库，那么具身智能的成长同样需要规模化的交互经验。现实中
阅读全文
宇树科技官宣：年内提交IPO，或将冲刺科创板
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心报道机器之心编辑部宇树的上市进程，终于又向前迈进了一步。9 月 2 日晚间，杭州宇树科技股份有限公司（简称「宇树科技」）发布声明说，预计于今年四季度向证券交易所提交上市申请文件，立即引来了大量
阅读全文
其实，扩散语言模型在最终解码之前很久，就已确定最终答案
作者：机器之心发布日期：2025-09-03 12:30:00
机器之心报道编辑：陈萍随着扩散语言模型（DLM）在各个领域的快速发展，其已成为自回归（AR）模型有力的替代方案。与 AR 模型相比，DLMs 的主要优势包括但不限于：高效的并行解码和灵活的生成顺序。尽
阅读全文
语音分离最全综述来了！清华等团队深度分析200+文章，系统解析「鸡尾酒会问题」研究
作者：机器之心发布日期：2025-09-03 12:30:00
语音分离领域针对具有挑战性的 “鸡尾酒会问题”，随着深度神经网络 (DNN) 的发展，该领域取得了革命性的进展。语音分离可以用于独立应用，在复杂的声学环境中提高语音清晰度。此外，它还可以作为其他语音处
阅读全文
冲上热搜！美团大模型，靠「快」火了
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心原创编辑：张倩、陈陈国内外开发者：亲测，美团新开源的模型速度超快！当 AI 真的变得像水和电一样普及之后，模型强不强已经不是大家唯一关心的问题了。从年初的 Claude 3.7 Sonnet、
阅读全文
DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心报道编辑：杜伟、+0这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。要理解这篇论文的重要性，我们先简单回顾一下
阅读全文
AI读网页，这次真不一样了，谷歌Gemini解锁「详解网页」新技能
作者：机器之心发布日期：2025-09-02 11:41:23
机器之心报道机器之心编辑部谷歌回归搜索老本行，这一次，它要让 AI 能像人一样「看见」网页。这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能（5 月 28 日已在 Go
阅读全文
性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA
作者：机器之心发布日期：2025-09-02 11:41:23
覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。一眼看到实力：关键成绩速览。备
阅读全文
首个为具身智能而生的大规模强化学习框架RLinf！清华、北京中关村学院、无问芯穹等重磅开源
作者：机器之心发布日期：2025-09-01 10:46:08
机器之心报道机器之心编辑部清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf：首个面向具身智能的“渲训推一体化”大规模强化学习框架。人工智能正在经历从 “感知” 到 “行动”
阅读全文
科普向：一文解构大模型后训练，GRPO和它的继任者们的前世今生
作者：机器之心发布日期：2025-09-01 10:46:08
机器之心报道编辑：冷猫GRPO 就像一个树节点，从这里开始开枝散叶。大语言模型的发展真是日新月异。从 DeepSeek 横空出世以来，其在大模型后训练的创新 GRPO 一跃成为强化学习黄金范式。GRP
阅读全文
科研智能体「漫游指南」—助你构建领域专属科研智能体
作者：机器之心发布日期：2025-09-01 10:46:08
欢迎关注中国科学院自动化研究所 & 北京中关村学院 & 芝加哥大学 & 西湖大学 & 腾讯带来的科研智能体方面的最新综述调研。当前基于大语言模型（LLM）的智能体构建通过推动自主科学研究推动 AI4S
阅读全文
那天，AI大模型想起了，被「失忆」所束缚的枷锁
作者：机器之心发布日期：2025-08-31 13:30:00
机器之心报道编辑：Panda记忆，你有我有，LLM 不一定有，但它们正在有。前些天，谷歌宣布 Gemini 具备了记忆能力。此前，它已经凭借长达 100 万 token 甚至更高的上下文长度，在「短期
阅读全文
LLM也具有身份认同？当LLM发现博弈对手是自己时，行为变化了
作者：机器之心发布日期：2025-08-31 13:30:00
机器之心报道编辑：PandaLLM 似乎可以扮演任何角色。使用提示词，你可以让它变身经验丰富的老师、资深程序员、提示词优化专家、推理游戏侦探…… 但你是否想过：LLM 是否存在某种身份认同？近日，哥伦
阅读全文
AI智能体是否能预测未来？字节跳动seed发布FutureX动态评测基准
作者：机器之心发布日期：2025-08-31 13:30:00
你有没有想过，AI 不仅能记住过去的一切，还能预见未知的未来？想象一下，让 AI 预测下周的股价、下个月的票房冠军、甚至下届世界杯的赢家……这听起来像科幻片，但如今，它已经成为现实中一场「极限挑战」。
阅读全文
23岁小哥被OpenAI开除，成立对冲基金收益爆表，165页论文传遍硅谷
作者：机器之心发布日期：2025-08-30 12:09:25
机器之心报道编辑：泽南、杨文他说：2027年AGI就来。23 岁被 OpenAI 开除，利用自己的「内部消息」打造了一支规模达 15 亿美元的基金，今年这支基金的表现还比华尔街高出 700%。如此跌宕
阅读全文
在美国，打工人越老越吃香，22-25岁新人最先被AI淘汰
作者：机器之心发布日期：2025-08-30 12:09:25
机器之心报道机器之心编辑部不敢相信，希望是我的幻觉。AI 的普及引发了全球范围内关于其对劳动市场潜在影响的辩论。历史上，技术总会以不同的方式影响着人们的工作和生活，有的工作被取代，有的工作被增强。近几
阅读全文
你能永远陪我聊天吗？复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!
作者：机器之心发布日期：2025-08-30 12:09:25
在《流浪地球 2》中图恒宇将 AI 永生数字生命变为可能，旨为将人类意识进行数字化备份并进行意识上传，以实现人类文明的完全数字化。如今随着扩散模型的兴起极大，涌现出大量基于音频驱动的数字人生成工作。具
阅读全文
时代2025 AI百人榜出炉：任正非、梁文锋、王兴兴、彭军、薛澜等入选，华人影响力爆棚
作者：机器之心发布日期：2025-08-29 12:31:09
机器之心报道机器之心编辑部刚刚，《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。在这份名单中，我们看到了很多熟悉的学者和企业家。令人惊喜的是，今年出现了更多的华人面孔，并且
阅读全文
谷歌Nano Banana全网刷屏，起底背后团队
作者：机器之心发布日期：2025-08-29 12:31:09
机器之心报道机器之心编辑部引入「交错生成」功能，增强模型在世界知识和创意解释方面的能力。香蕉也能变礼服？Google 真的做到了！在最新一期谷歌开发者节目里，Google DeepMind 团队首次全
阅读全文
AI Agent组团搞事：在你常刷的App里，舆论操纵、电商欺诈正悄然上演
作者：机器之心发布日期：2025-08-29 12:31:09
本文作者来自上海交通大学和上海人工智能实验室，核心贡献者包括任麒冰、谢思韬、魏龙轩，指导老师为马利庄老师和邵婧老师，研究方向为安全可控大模型和智能体。在科幻电影中，我们常看到 AI 反叛人类的情节，但
阅读全文