机器之心

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」
作者：机器之心发布日期：2025-09-17 17:34:41
自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。然而，现有方法多依赖于监督微调（SFT），模型一来只能
阅读全文
高阶程序，让AI从技术可行到商业可信的最后一公里
作者：机器之心发布日期：2025-09-16 19:45:58
机器之心报道编辑：Panda很多人相信，我们已经进入了所谓的「AI 下半场」，一个模型能力足够强大、应用理应爆发的时代。然而，对于这个时代真正缺少的东西，不同的人有不同的侧重，比如（前）OpenAI
阅读全文
网络顶会获奖！华为提出端网协同RDMA传输架构，解决大规模AI集群网络可扩展性问题
作者：机器之心发布日期：2025-09-16 19:45:58
机器之心发布机器之心编辑部近日，全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕，共 3 篇论文获奖，华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果，获
阅读全文
具身智能能力狂飙，安全却严重滞后？首个安全可信EAI框架与路线图出炉！
作者：机器之心发布日期：2025-09-16 19:45:58
近年来，以人形机器人、自动驾驶为代表的具身人工智能（Embodied Artificial Intelligence, EAI）正以前所未有的速度发展，从数字世界大步迈向物理现实。然而，当一次错误的风
阅读全文
从「对口型」到「会表演」，刚进化的可灵AI数字人，技术公开了
作者：机器之心发布日期：2025-09-15 20:17:07
机器之心发布机器之心编辑部让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的，是当明快的旋律响起，它会自然扬起嘴角，眼神含笑；当进入说唱段落，它会随着鼓点起伏，肩膀与手臂有节奏地带动气氛。观众
阅读全文
数字生活的原生入口：蚂蚁集团发布AI眼镜全新技术框架gPass
作者：机器之心发布日期：2025-09-15 20:17:07
机器之心发布机器之心编辑部日前，在 2025 Inclusion・外滩大会上，蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力，致力于实现 A
阅读全文
OpenVision 2：大道至简的生成式预训练视觉编码器
作者：机器之心发布日期：2025-09-15 20:17:07
本文来自加州大学圣克鲁兹分校（UCSC）、苹果公司（Apple）与加州大学伯克利分校（UCB）的合作研究。第一作者刘彦青，本科毕业于浙江大学，现为UCSC博士生，研究方向包括多模态理解、视觉-语言预训
阅读全文
抢先实测美团首个AI Agent，让我体验一把「懒人点餐」的快乐
作者：机器之心发布日期：2025-09-14 13:13:34
机器之心报道编辑：杨文AI点餐时代来了？这一年，AI Agent 的热度一路走高。从大洋彼岸的 OpenAI、谷歌等 AI 巨头，到国内的各类创业公司，大家都在摸索如何让 AI 真正帮人干活。相比需要
阅读全文
将KV Cache预算降至1.5%！他们用进化算法把大模型内存占用砍下来了
作者：机器之心发布日期：2025-09-14 13:13:34
机器之心报道编辑：张倩只用 1.5% 的内存预算，性能就能超越使用完整 KV cache 的模型，这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路
阅读全文
LLaSO 横空出世：逻辑智能推出全球首个完全开源语音大模型框架，定义 LSLM 研究新基准
作者：机器之心发布日期：2025-09-14 13:13:34
在大型语言模型（LLM）的浪潮下，多模态 AI 取得了飞速发展，尤其是在视觉语言（LVLM）领域，已经形成了成熟的研究范式。然而，与之形成鲜明对比的是，大型语音语言模型（LSLM）的发展却显得零散且步
阅读全文
Meta开源MobileLLM-R1模型，不到1B参数，用1/10的训练就超越了Qwen3
作者：机器之心发布日期：2025-09-13 16:52:17
机器之心报道编辑：泽南、杨文与其他全开源模型相比，性能提升2-5倍。小参数模型也进入了 R1 时代，这次开源出新技术的是 Meta。本周五，Meta AI 团队正式发布了 MobileLLM-R1。H
阅读全文
清华、上海AI Lab等顶级团队发布推理模型RL超全综述，探索通往超级智能之路
作者：机器之心发布日期：2025-09-13 16:52:17
机器之心报道编辑：冷猫超高规格团队，重新审视RL推理领域发展策略。在人工智能的发展中，强化学习 (RL) 一直是一种非常重要的方法。自 1998 年 Sutton 提出强化学习概念以来，就明确了只要给
阅读全文
快手可灵团队提出MIDAS：压缩比64倍、延迟低于500ms，多模态互动数字人框架实现交互生成新突破
作者：机器之心发布日期：2025-09-13 16:52:17
数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而，现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大，无法实时响应，要么只能处理单一模态输入，
阅读全文
扩散语言模型也有MoE版本了！蚂蚁&人大从头训练LLaDA-MoE，即将完全开源
作者：机器之心发布日期：2025-09-12 19:28:02
机器之心报道编辑：张倩挑战自回归的扩散语言模型刚刚迎来了一个新里程碑：蚂蚁集团和人大联合团队用 20T 数据，从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数
阅读全文
如何为LLM智能体编写工具？Anthropic官方教程来了
作者：机器之心发布日期：2025-09-12 19:28:02
机器之心报道机器之心编辑部好工具，才有好智能体。智能体（Agent）时代，工具已不再只是传统 API 或函数接口的简单封装，而是决定智能体能否高效完成任务的关键。为了让智能体真正释放潜力，我们需要重新
阅读全文
腾讯优图重磅开源Youtu-GraphRAG，实现图检索增强技术新突破
作者：机器之心发布日期：2025-09-12 19:28:02
图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗时
阅读全文
刚刚，Thinking Machines Lab首次发长文，揭开LLM推理不确定性真相
作者：机器之心发布日期：2025-09-11 11:32:23
机器之心报道机器之心编辑部真正的元凶是缺乏批次不变性。就在今天，由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab，
阅读全文
英伟达的AI已经开始接管整个项目了？SATLUTION自主进化代码库登顶SAT竞赛
作者：机器之心发布日期：2025-09-11 11:32:23
机器之心报道机器之心编辑部AI 开发复杂软件的时代即将到来？近年来，以 Google 的 AlphaEvolve 为代表的研究已经证明，AI 智能体可以通过迭代来优化算法，甚至在某些小型、独立的编程任
阅读全文
大模型智能体不止能写代码，还能被训练成白帽黑客
作者：机器之心发布日期：2025-09-11 11:32:23
当人们还在惊叹大模型能写代码、能自动化办公时，它们正在悄然踏入一个更敏感、更危险的领域 —— 网络安全。想象一下，如果 AI 不只是写代码的助手，而是能够像「白帽黑客」一样，在不破坏系统的前提下模拟攻
阅读全文
AI应用元年，这场标杆赛事见证了中国创新速度与野心
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心原创编辑：吴昕一场关于未来金融智能的集体预演，见证了创业者们的冲刺，也折射出一个行业的进化。2025 年的 AI ，正在上演「双线长跑」。一端是大模型底层的持续进化，远未触顶；另一端是场景应用
阅读全文
AI胡说八道这事，终于有人管了？
作者：机器之心发布日期：2025-09-10 12:00:02
机器之心报道编辑：+0、张倩想象一下，如果 ChatGPT 等 AI 大模型在生成的时候，能把自己不确定的地方都标记出来，你会不会对它们生成的答案放心很多？上周末，OpenAI 发的一篇论文引爆了社区
阅读全文
人人都能炼专属Agent，上海交大开源端侧Agent全栈工具链，真实场景性能超GPT-5！
作者：机器之心发布日期：2025-09-10 12:00:02
打开手机，让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务，这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体，正在从科幻走进现实。然而，通往 “解放双手”
阅读全文
文心新出的推理大模型，给了我们信心
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道机器之心编辑部当下的大语言模型，不怕它搞不定，就怕它胡说八道：有「幻觉」存在，我们经常会下意识地不信任 AI 输出的结果。就在上周，OpenAI 的论文《Why Language Mode
阅读全文
SFT远不如RL？永不过时的剃刀原则打开「终身学习」大模型训练的大门
作者：机器之心发布日期：2025-09-09 19:43:45
机器之心报道编辑：冷猫我们已经进入了大模型时代，越来越多的应用依赖大模型的能力，可以说大模型已经成为智能化基础设施的核心组成部分，支撑着语言，视觉分析，智能驾驶，机器人等各种下游应用。在大模型的实际使
阅读全文
从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准
作者：机器之心发布日期：2025-09-09 19:43:45
在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：表面
阅读全文
全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心原创作者：冷猫好玩好用的明星视频生成产品再更新，用户操作基础，模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域，纳米香蕉在短期内
阅读全文
扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍
作者：机器之心发布日期：2025-09-08 14:19:27
机器之心报道编辑：+0，冷猫经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。近期，Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架，旨
阅读全文
具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法
作者：机器之心发布日期：2025-09-08 14:19:27
在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。然而，现有 VLA 基座模型
阅读全文
国内外AI大厂重押，初创梭哈，谁能凭「记忆」成为下一个「DeepSeek」？
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道作者：Youli谁率先让模型拥有「记忆」，谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗？如果时间往前推半年或四五个月，业界对于这一问题可能都是疑惑、不解：彼时 Dee
阅读全文
斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出
作者：机器之心发布日期：2025-09-07 13:10:24
机器之心报道机器之心编辑部自 2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大，预训练
阅读全文