机器之心

快手解密「AI印钞机」，首提生成式强化学习出价技术，为平台实现超过3%的广告收入提升
作者：机器之心发布日期：2025-09-23 12:00:12
机器之心报道编辑：Panda、张倩前段时间，谷歌母公司 Alphabet 市值突破 3 万亿美元，成为第四家市值达到这一门槛的公司。如果时间倒回到两年半以前，谷歌自己可能都没有想到这一结果。当时，Ch
阅读全文
庞若鸣还有苹果论文？改善预训练高质量数据枯竭困境
作者：机器之心发布日期：2025-09-23 12:00:12
机器之心报道编辑：冷猫数月前，苹果基础模型团队负责人、杰出工程师庞若鸣（Ruoming Pang）离职加入 Meta。扎克伯格豪掷两亿美元招揽庞若鸣加入超级智能团队。根据庞若鸣的领英信息，他已在 Me
阅读全文
超越免训练剪枝：LightVLA引入可微分token剪枝，首次实现VLA模型性能和效率的双重突破
作者：机器之心发布日期：2025-09-23 12:00:12
本文共同第一作者蒋体通，清华大学直博五年级学生，研究方向是VLA、自动驾驶和人机交互等。共同第一作者蒋雪枫，中国科学院计算技术研究所直博五年级学生，研究方向聚焦弱监督学习，多模态大模型应用和生成式自动
阅读全文
这一次，天玑9500的端侧AI能力，友商赶不上了
作者：机器之心发布日期：2025-09-22 18:23:50
机器之心报道编辑：泽南9 月 22 日下午，联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500，并展示了一系列新形态端侧的 AI 应用，在公众层面首次推动端侧 AI 从尝鲜到好用。
阅读全文
苹果传统强项再发力，视觉领域三种模态终于统一
作者：机器之心发布日期：2025-09-22 18:23:50
机器之心报道编辑：冷猫苹果新品发售的热度还没消退，大家都在讨论新手机的硬件进化。而在 AI 功能方面，苹果仍然没有拿出什么颠覆性的应用，Apple Intelligence 在国内仍然遥遥无期。再叠加
阅读全文
图灵得主Yoshua Bengio，开始警惕AI有意识了
作者：机器之心发布日期：2025-09-22 18:23:50
机器之心报道机器之心编辑部设计出具有意识（conscious）的 AI 系统是否可行？一直以来，这个问题就存在分歧。一些人认为意识是大脑特有的生物特性，这似乎排除了 AI 存在意识的可能性。另一些人则
阅读全文
用2D数据解锁3D世界：首个面向运动学部件分解的多视角视频扩散框架
作者：机器之心发布日期：2025-09-22 18:23:50
张昊，伊利诺伊大学香槟分校（UIUC）博士生，研究方向涵盖 3D/4D 重建、生成建模与物理驱动动画。目前在 Snap Inc. 担任研究实习生，曾于 Stability AI 和上海人工智能实验室
阅读全文
全球双榜SOTA！明略科技专有大模型 Mano开启GUI智能操作新时代
作者：机器之心发布日期：2025-09-21 13:24:05
机器之心原创编辑：吴昕、冷猫明略科技的专有 GUI 大模型 Mano 在行业公认的 Mind2Web 和 OSWorld 两大挑战性基准测试中，均取得了创纪录的 SOTA 成绩。通过在线强化学习和训练
阅读全文
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走，马斯克直呼：起飞
作者：机器之心发布日期：2025-09-21 13:24:05
机器之心报道机器之心编辑部大厂之间不是「你挖我」，就是「我挖你」。那边特斯拉 Optimus AI 团队负责人 Ashish Kumar 被挖去 Meta，这边谷歌 DeepMind 资深研究科学家被
阅读全文
工业级3D世界构建提速90倍！全新框架LatticeWorld让虚拟世界「一句话成真」
作者：机器之心发布日期：2025-09-21 13:24:05
本文的作者来自网易、香港城市大学、北京航空航天大学和清华大学等机构。本文的共同第一作者为网易互娱段颖琳、北京航空航天大学邹征夏、网易互娱谷统伟。本文的通讯作者为香港城市大学邱爽、网易互娱陈康。论文题目
阅读全文
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型，性能登顶行业基准
作者：机器之心发布日期：2025-09-20 12:34:25
机器之心报道机器之心编辑部科技的走向、股市的涨跌、比赛的胜负、选举的结果…… 在 AI 时代，未来还会像过去那样不可知吗？全球首个动态实时 LLM 智能体未来预测基准 FutureX 推出，被马斯克称
阅读全文
OpenAI从苹果挖了20多人搞硬件，知情人士：苹果创新缓慢、官僚主义令人厌倦
作者：机器之心发布日期：2025-09-20 12:34:25
机器之心报道编辑：张倩苹果员工和 OpenAI 双向奔赴了，一个嫌自家产品保守，一个硬件人才紧缺。据外媒报道，OpenAI 正在从苹果挖走硬件、设计和供应链方面的人才，以加速硬件开发，并且已开始利用苹
阅读全文
Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型
作者：机器之心发布日期：2025-09-20 12:34:25
本文第一作者谢之非，共同第一作者马子阳皆是来自于南洋理工大学的博士生。通讯作者为新加坡国立大学特聘教授颜水成和南洋理工大学数据与科学系校长讲席教授苗春燕。共同作者为腾讯AI首席专家叶德珩和新加坡国立大
阅读全文
超强开源模型Qwen3、DeepSeek-V3.1，都被云计算一哥「收」了
作者：机器之心发布日期：2025-09-19 18:40:44
机器之心报道机器之心编辑部在 AI 领域，亚马逊云科技有着自己的打法，模型选择权交给用户。「云计算一哥」亚马逊云科技又「收」新模型了。就在刚刚过去的 8 月，亚马逊云科技宣布，其 Amazon Bed
阅读全文
攻克大模型训推差异难题，蚂蚁开源新一代推理模型Ring-flash-2.0
作者：机器之心发布日期：2025-09-19 18:40:44
机器之心发布机器之心编辑部“MoE+Long-CoT（长思维链）+RL（强化学习）” 这条技术路线存在难以兼顾训练稳定性和效果的难题。9 月 19 日，蚂蚁百灵大模型团队把 “难啃的骨头” 直接做成开
阅读全文
给大模型「精准手术」：美团智能客服提出逆向学习技术精准纠偏，风险控制提升38%
作者：机器之心发布日期：2025-09-19 18:40:44
美团智能客服最新研究，提出了一种逆向学习新技术（简称 “逆学习”），能像 “精准手术” 一样，安全、高效地抑制模型中的特定错误和风险行为，在关键风险控制指标上提升 38 个百分点以上的同时，保障整体服
阅读全文
OneSearch，揭开快手电商搜索「一步到位」的秘技
作者：机器之心发布日期：2025-09-18 12:29:05
机器之心发布机器之心编辑部还有一个多月，一年一度的“双十一”购物节就要来了！作为消费者，你通常会如何寻找心仪的商品呢？或许你兴致勃勃地在搜索框里敲下关键词，却发现呈现出来的商品列表总是差强人意。那么，
阅读全文
刚刚，OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平
作者：机器之心发布日期：2025-09-18 12:29:05
机器之心报道编辑：杨文、+0IMO 之后，OpenAI 与 Gemini 双双加冕 ICPC 2025 金牌。就在刚刚，OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平。其中，Open
阅读全文
从一个公众号智能体说起：好用的Agent，究竟需要什么?
作者：机器之心发布日期：2025-09-18 12:29:05
机器之心报道机器之心编辑部Agent 今年这么火，AI 圈几乎人人都在讨论。但抛开那些花哨的概念，一个好用的 Agent 究竟应该是什么样的？咱们不妨接地气一点，从每天都刷一刷的「公众号」聊起。不知道
阅读全文
B站出海的强有力支柱：最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代
作者：机器之心发布日期：2025-09-18 12:29:05
最近在 B 站上，你是否也刷到过一些 “魔性” 又神奇的 AI 视频？比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色，连情感和韵律都做到了高度还原！更让人惊讶的
阅读全文
没想到，音频大模型开源最彻底的，居然是小红书
作者：机器之心发布日期：2025-09-17 17:34:41
机器之心原创编辑：杜伟不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商
阅读全文
6.1B打平40B Dense模型，蚂蚁开源最新MoE模型Ling-flash-2.0
作者：机器之心发布日期：2025-09-17 17:34:41
机器之心发布机器之心编辑部今天，蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型，Ling-flash-2.0 以总参数
阅读全文
「AI助手」真来了？谷歌牵头推进Agent支付协议AP2
作者：机器之心发布日期：2025-09-17 17:34:41
机器之心报道机器之心编辑部近日，Agent 领域再次传来新进展，谷歌宣布推出 Agent 支付协议 ——AP2（Agent Payments Protocol ），这是一种开放的共享协议，为 Agen
阅读全文
腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」
作者：机器之心发布日期：2025-09-17 17:34:41
自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。然而，现有方法多依赖于监督微调（SFT），模型一来只能
阅读全文
高阶程序，让AI从技术可行到商业可信的最后一公里
作者：机器之心发布日期：2025-09-16 19:45:58
机器之心报道编辑：Panda很多人相信，我们已经进入了所谓的「AI 下半场」，一个模型能力足够强大、应用理应爆发的时代。然而，对于这个时代真正缺少的东西，不同的人有不同的侧重，比如（前）OpenAI
阅读全文
网络顶会获奖！华为提出端网协同RDMA传输架构，解决大规模AI集群网络可扩展性问题
作者：机器之心发布日期：2025-09-16 19:45:58
机器之心发布机器之心编辑部近日，全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕，共 3 篇论文获奖，华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果，获
阅读全文
具身智能能力狂飙，安全却严重滞后？首个安全可信EAI框架与路线图出炉！
作者：机器之心发布日期：2025-09-16 19:45:58
近年来，以人形机器人、自动驾驶为代表的具身人工智能（Embodied Artificial Intelligence, EAI）正以前所未有的速度发展，从数字世界大步迈向物理现实。然而，当一次错误的风
阅读全文
从「对口型」到「会表演」，刚进化的可灵AI数字人，技术公开了
作者：机器之心发布日期：2025-09-15 20:17:07
机器之心发布机器之心编辑部让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的，是当明快的旋律响起，它会自然扬起嘴角，眼神含笑；当进入说唱段落，它会随着鼓点起伏，肩膀与手臂有节奏地带动气氛。观众
阅读全文
数字生活的原生入口：蚂蚁集团发布AI眼镜全新技术框架gPass
作者：机器之心发布日期：2025-09-15 20:17:07
机器之心发布机器之心编辑部日前，在 2025 Inclusion・外滩大会上，蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力，致力于实现 A
阅读全文
OpenVision 2：大道至简的生成式预训练视觉编码器
作者：机器之心发布日期：2025-09-15 20:17:07
本文来自加州大学圣克鲁兹分校（UCSC）、苹果公司（Apple）与加州大学伯克利分校（UCB）的合作研究。第一作者刘彦青，本科毕业于浙江大学，现为UCSC博士生，研究方向包括多模态理解、视觉-语言预训
阅读全文