机器之心

抢先实测美团首个AI Agent，让我体验一把「懒人点餐」的快乐
作者：机器之心发布日期：2025-09-14 13:13:34
机器之心报道编辑：杨文AI点餐时代来了？这一年，AI Agent 的热度一路走高。从大洋彼岸的 OpenAI、谷歌等 AI 巨头，到国内的各类创业公司，大家都在摸索如何让 AI 真正帮人干活。相比需要
阅读全文
将KV Cache预算降至1.5%！他们用进化算法把大模型内存占用砍下来了
作者：机器之心发布日期：2025-09-14 13:13:34
机器之心报道编辑：张倩只用 1.5% 的内存预算，性能就能超越使用完整 KV cache 的模型，这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路
阅读全文
LLaSO 横空出世：逻辑智能推出全球首个完全开源语音大模型框架，定义 LSLM 研究新基准
作者：机器之心发布日期：2025-09-14 13:13:34
在大型语言模型（LLM）的浪潮下，多模态 AI 取得了飞速发展，尤其是在视觉语言（LVLM）领域，已经形成了成熟的研究范式。然而，与之形成鲜明对比的是，大型语音语言模型（LSLM）的发展却显得零散且步
阅读全文
Meta开源MobileLLM-R1模型，不到1B参数，用1/10的训练就超越了Qwen3
作者：机器之心发布日期：2025-09-13 16:52:17
机器之心报道编辑：泽南、杨文与其他全开源模型相比，性能提升2-5倍。小参数模型也进入了 R1 时代，这次开源出新技术的是 Meta。本周五，Meta AI 团队正式发布了 MobileLLM-R1。H
阅读全文
清华、上海AI Lab等顶级团队发布推理模型RL超全综述，探索通往超级智能之路
作者：机器之心发布日期：2025-09-13 16:52:17
机器之心报道编辑：冷猫超高规格团队，重新审视RL推理领域发展策略。在人工智能的发展中，强化学习 (RL) 一直是一种非常重要的方法。自 1998 年 Sutton 提出强化学习概念以来，就明确了只要给
阅读全文
快手可灵团队提出MIDAS：压缩比64倍、延迟低于500ms，多模态互动数字人框架实现交互生成新突破
作者：机器之心发布日期：2025-09-13 16:52:17
数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而，现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大，无法实时响应，要么只能处理单一模态输入，
阅读全文
扩散语言模型也有MoE版本了！蚂蚁&人大从头训练LLaDA-MoE，即将完全开源
作者：机器之心发布日期：2025-09-12 19:28:02
机器之心报道编辑：张倩挑战自回归的扩散语言模型刚刚迎来了一个新里程碑：蚂蚁集团和人大联合团队用 20T 数据，从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数
阅读全文
如何为LLM智能体编写工具？Anthropic官方教程来了
作者：机器之心发布日期：2025-09-12 19:28:02
机器之心报道机器之心编辑部好工具，才有好智能体。智能体（Agent）时代，工具已不再只是传统 API 或函数接口的简单封装，而是决定智能体能否高效完成任务的关键。为了让智能体真正释放潜力，我们需要重新
阅读全文
腾讯优图重磅开源Youtu-GraphRAG，实现图检索增强技术新突破
作者：机器之心发布日期：2025-09-12 19:28:02
图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗时
阅读全文
刚刚，Thinking Machines Lab首次发长文，揭开LLM推理不确定性真相
作者：机器之心发布日期：2025-09-11 11:32:23
机器之心报道机器之心编辑部真正的元凶是缺乏批次不变性。就在今天，由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab，
阅读全文
英伟达的AI已经开始接管整个项目了？SATLUTION自主进化代码库登顶SAT竞赛
作者：机器之心发布日期：2025-09-11 11:32:23
机器之心报道机器之心编辑部AI 开发复杂软件的时代即将到来？近年来，以 Google 的 AlphaEvolve 为代表的研究已经证明，AI 智能体可以通过迭代来优化算法，甚至在某些小型、独立的编程任
阅读全文
大模型智能体不止能写代码，还能被训练成白帽黑客
作者：机器之心发布日期：2025-09-11 11:32:23
当人们还在惊叹大模型能写代码、能自动化办公时，它们正在悄然踏入一个更敏感、更危险的领域 —— 网络安全。想象一下，如果 AI 不只是写代码的助手，而是能够像「白帽黑客」一样，在不破坏系统的前提下模拟攻
阅读全文
AI应用元年，这场标杆赛事见证了中国创新速度与野心
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心原创编辑：吴昕一场关于未来金融智能的集体预演，见证了创业者们的冲刺，也折射出一个行业的进化。2025 年的 AI ，正在上演「双线长跑」。一端是大模型底层的持续进化，远未触顶；另一端是场景应用
阅读全文
AI胡说八道这事，终于有人管了？
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心报道编辑：+0、张倩想象一下，如果 ChatGPT 等 AI 大模型在生成的时候，能把自己不确定的地方都标记出来，你会不会对它们生成的答案放心很多？上周末，OpenAI 发的一篇论文引爆了社区
阅读全文
人人都能炼专属Agent，上海交大开源端侧Agent全栈工具链，真实场景性能超GPT-5！
作者：机器之心发布日期：2025-09-10 12:00:02
打开手机，让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务，这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体，正在从科幻走进现实。然而，通往 “解放双手”
阅读全文
文心新出的推理大模型，给了我们信心
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道机器之心编辑部当下的大语言模型，不怕它搞不定，就怕它胡说八道：有「幻觉」存在，我们经常会下意识地不信任 AI 输出的结果。就在上周，OpenAI 的论文《Why Language Mode
阅读全文
SFT远不如RL？永不过时的剃刀原则打开「终身学习」大模型训练的大门
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道编辑：冷猫我们已经进入了大模型时代，越来越多的应用依赖大模型的能力，可以说大模型已经成为智能化基础设施的核心组成部分，支撑着语言，视觉分析，智能驾驶，机器人等各种下游应用。在大模型的实际使
阅读全文
从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准
作者：机器之心发布日期：2025-09-09 19:43:45
在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：表面
阅读全文
全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心原创作者：冷猫好玩好用的明星视频生成产品再更新，用户操作基础，模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域，纳米香蕉在短期内
阅读全文
扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心报道编辑：+0，冷猫经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。近期，Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架，旨
阅读全文
具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法
作者：机器之心发布日期：2025-09-08 14:19:27
在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。然而，现有 VLA 基座模型
阅读全文
国内外AI大厂重押，初创梭哈，谁能凭「记忆」成为下一个「DeepSeek」？
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道作者：Youli谁率先让模型拥有「记忆」，谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗？如果时间往前推半年或四五个月，业界对于这一问题可能都是疑惑、不解：彼时 Dee
阅读全文
斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道机器之心编辑部自 2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大，预训练
阅读全文
字节跳动Seed推出「机器人大脑」Robix：让机器人学会思考、规划与灵活互动
作者：机器之心发布日期：2025-09-07 13:10:24
近日，字节跳动 Seed 团队发布了最新的机器人研究成果——Robix，一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题：Robix: A Unified Model for Robo
阅读全文
OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心报道编辑：PandaAI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。大模型会有幻觉，
阅读全文
00后以1.1亿美金「掀桌」，硅谷AI将书写影视新传奇终结制片旧时代
作者：机器之心发布日期：2025-09-06 11:11:15
机器之心发布机器之心编辑部最年轻的工程师，和团队一起将产品卖给 Fortune 500 的客户，从 0 带到 10。她，22 岁，成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D
阅读全文
任意骨骼系统的模型都能驱动？AnimaX提出基于世界模型的3D动画生成新范式
作者：机器之心发布日期：2025-09-06 11:11:15
本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。本文的第一作者为北京航空航天大学硕士生黄泽桓。本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。在游戏
阅读全文
Nano Banana爆火之后，一个神秘的「胡萝卜」代码模型又上线了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心报道机器之心编辑部以前，每当上线一个新模型，大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说，有时候名字起得太出彩，甚至能把模型本身给卷下去。别人还没搞懂它能干嘛，名字已经在朋友圈刷屏了。不过
阅读全文
沉寂一个月，openPangu性能飙升8%！华为1B开源模型来了
作者：机器之心发布日期：2025-09-05 12:28:02
机器之心发布机器之心编辑部在端侧 AI 这个热门赛道，华为盘古大模型扔下了一颗 “重磅炸弹” 。如今，云端大模型已经能侃侃而谈、答疑解惑。但如果这些 AI 大脑能被装进手机、摄像头甚至无人机，会带来怎
阅读全文
多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！
作者：机器之心发布日期：2025-09-05 12:28:02
本系列工作核心作者：郭海洋（自动化所博士生）、朱飞（中科院香港院AI中心AP）、曾繁虎（自动化所硕士生）、刘文卓（自动化所博士生）、赵宏博（自动化所博士生）。通讯作者为自动化所博士生
阅读全文