机器之心

Meta内部混乱持续：FAIR自由不再，LeCun考虑辞职
作者：机器之心发布日期：2025-10-03 11:36:20
机器之心报道编辑：+0Meta 内部混战又有新剧情了，这次主角是 FAIR 实验室。据 The Information 报道，两位知情人士透露，Meta 最近对 FAIR 实验室施加了一项新政策：所有
阅读全文
又一推理新范式：将LLM自身视作「改进操作符」，突破长思维链极限
作者：机器之心发布日期：2025-10-03 11:36:20
机器之心报道机器之心编辑部推理训练促使大语言模型（LLM）生成长思维链（long CoT），这在某些方面有助于它们探索解决策略并进行自我检查。虽然这种方式提高了准确性，但也增加了上下文长度、token
阅读全文
NIPS 2025 Spotlight | 港大提出TreeSynth方法，一句话生成百万规模数据集
作者：机器之心发布日期：2025-10-03 11:36:20
本文第一作者王升，陈鹏安与周靖淇均来自香港大学。通讯作者为香港大学计算机科学系吴川教授与孔令鹏教授。其他作者还包括来自香港大学的李沁桐、董经纬、高佳慧，以及香港中文大学的薛博阳、江继越。想象一下，你接
阅读全文
开发者狂喜：Thinking Machines发布首款产品Tinker，后训练麻烦全给包了
作者：机器之心发布日期：2025-10-02 11:09:53
机器之心报道机器之心编辑部对于大模型开发者 / 研究者来说，今天是重要的一天。因为刚刚，OpenAI 前 CTO Mira Murati 创办的 Thinking Machines 推出了首款产品 —
阅读全文
小红书发布FireRedChat：首个可私有化部署的全双工大模型语音交互系统
作者：机器之心发布日期：2025-10-02 11:09:53
小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat，自研流式 pVAD 与 EoT 让语音交互更加自然，首发级联与半级联两套实现，端到端时延逼近工业级应用。
阅读全文
Sora 2深夜来袭，OpenAI直接推出App，视频ChatGPT时刻到了
作者：机器之心发布日期：2025-10-01 07:47:17
机器之心报道机器之心编辑部没想到吧，在别家节前卷大模型时，OpenAI 悄悄发布了 Sora2。而且，这次是直接产品化，推出了 App，甚至还有配套的视频推送算法，声称可以防成瘾。这是要做自己的 Ti
阅读全文
CUDA内核之神、全球最强GPU程序员？OpenAI的这位幕后大神是谁
作者：机器之心发布日期：2025-10-01 07:47:17
机器之心报道编辑：+0在 AI 圈里，聚光灯总是追逐着那些履历光鲜的明星人物。但一个伟大的团队，不仅有台前的明星，更有无数在幕后贡献关键力量的英雄。之前我们介绍了 OpenAI 的两位波兰工程师，最近
阅读全文
复旦、同济和港中文等重磅发布：强化学习在大语言模型全周期的全面综述
作者：机器之心发布日期：2025-10-01 07:47:17
近年来，以强化学习为核心的训练方法显著提升了大语言模型（Large Language Models, LLMs）的推理能力与对齐性能，尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。尽管
阅读全文
节前重磅：开源旗舰模型新SOTA，智谱GLM-4.6问世
作者：机器之心发布日期：2025-09-30 16:41:35
机器之心报道机器之心编辑部新一代大模型的发布，都赶在了国庆假期前。昨天，深度求索刚刚开源 DeepSeek-V3.2-Exp。今天，另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM
阅读全文
CAIR开源发布超声基座大模型EchoCare“聆音”，10余项医学任务性能登顶
作者：机器之心发布日期：2025-09-30 16:41:35
机器之心发布机器之心编辑部2025年9月17日，中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”）。
阅读全文
NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型，推动自动驾驶迈向视觉推理
作者：机器之心发布日期：2025-09-30 16:41:35
面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介，易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive（FutureSightDrive）提出 “时空视觉 CoT”（Spati
阅读全文
SALMONN 系列音视频理解大模型霸榜回归！推理增强、高帧率、无文本泄漏全线突破
作者：机器之心发布日期：2025-09-29 14:52:00
机器之心报道机器之心编辑部SALMONN 家族在首个通用音频理解模型（ICLR 2024）和首个全要素音视频理解模型 video-SALMONN（ICML 2024）基础上再次迎来重磅扩容，霸榜各大音
阅读全文
首个零样本跨本体泛化开源具身模型：智源RoboBrain-X0 技术细节全解析
作者：机器之心发布日期：2025-09-29 14:52:00
机器之心发布机器之心编辑部为具身智能行业提供了一个可复用、可扩展的通用基座，同时开源训练数据集。今天，北京智源人工智能研究院（BAAI）正式开源 RoboBrain-X0，一个能够在零样本泛化、轻量微
阅读全文
腾讯混元3D-Omni：3D版ControlNet突破多模态控制，实现高精度3D资产生成
作者：机器之心发布日期：2025-09-29 14:52:00
近年来，3D 原生生成模型在游戏、影视和设计领域的资产创建中展现出强大潜力。然而，大多数现有方法仍主要依赖图像作为条件输入，缺乏细粒度、多模态的控制能力，限制了其在实际生产流程中的应用。为解决这一瓶颈
阅读全文
「从追赶者到引领者，路有多远？」我们和CANN一线开发者聊了聊
作者：机器之心发布日期：2025-09-28 12:47:43
机器之心报道编辑：Panda、泽南AI 行业很多人相信，我们正在或已经进入所谓的「AI 下半场」。在这一轮 AI 的浪潮中，硬件的竞争早已不再是单纯的算力比拼，而是一场围绕软件、开发者与生态的「护城河
阅读全文
RLHF与RLVR全都要，陈丹琦团队最新力作将推理能力拓展到通用智能
作者：机器之心发布日期：2025-09-28 12:47:43
机器之心报道编辑：冷猫思考自身行为的后果，并在必要时进行修正 —— 这是人类智慧的核心特征之一。一个月前，我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines La
阅读全文
一文读懂鲸智百应：驱动组织进化的企业AI操作系统，让企业从「用AI」到「是AI」
作者：机器之心发布日期：2025-09-28 12:47:43
机器之心发布机器之心编辑部「统一认知、智能执行、决策中枢、记忆进化、智能体工厂、AI治理」六大维度，让企业彻底跳出「用AI」的工具思维，成为「AI原生组织」。走进任何一家大中型企业，「系统横跳」已成为
阅读全文
登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平
作者：机器之心发布日期：2025-09-28 12:47:43
由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局（包括车道线和 3D 框），就可以生成逼真的图像和点云视频。论
阅读全文
AI能「拍」好电影？五部短片亮相釜山电影节，答案出乎意料
作者：机器之心发布日期：2025-09-27 13:44:25
机器之心原创编辑：吴昕全 AI 生成高质量剧情长片已经在技术上成为可能。去年九月，中国香港动画公司 ManyMany Creations Limited 的几位年轻主创立下了一个几乎「逆天」的目标——
阅读全文
OpenAI研究大模型对GDP贡献，三大行业已能代替人类，并自曝不敌Claude
作者：机器之心发布日期：2025-09-27 13:44:25
机器之心报道编辑：泽南、杨文AI 的颠覆近在眼前，奥特曼不是乱说的。时至今日，我们已见过太多大模型的评估方法。比如涵盖了数十个学科的考试式问题的学术基准 MMLU，还有 SWE-Bench （软件工程
阅读全文
规范对齐时代：GPT-5 断层领先，让安全与行为边界更明晰
作者：机器之心发布日期：2025-09-27 13:44:25
张昊然，上海交通大学人工智能学院的博士一年级学生，主要研究兴趣为大模型推理和可信人工智能。去年 12 月，OpenAI 提出的 Deliberative Alignment 引发了广泛关注。面对用户安
阅读全文
京东AI「结果」：深度应用已成当下，万亿生态瞄准未来
作者：机器之心发布日期：2025-09-26 17:33:11
机器之心报道作者：Youli谁最懂场景，谁赢得未来。9 月 25 日，北京，深秋的气息逐渐浓烈，即便太阳高悬，空气中还是流露出些许凉意，而在中关村国际创新中心，一墙之隔的里面，却是喧哗而热闹。人形机器
阅读全文
Agentic Coding表现创新高，全新KAT系列模型强势霸榜SWE-Bench
作者：机器之心发布日期：2025-09-26 17:33:11
近期，快手 Kwaipilot 团队推出了 KAT 系列两款突破性 Agentic Coding 大模型：开源 32B 参数模型 KAT-Dev-32B 与闭源旗舰模型 KAT-Coder。这两款模
阅读全文
IEEE TPAMI 2025 | 北京大学提出分布驱动的终身学习范式，用结构建模解决灾难性遗忘
作者：机器之心发布日期：2025-09-26 17:33:11
近日，北京大学王选计算机研究所周嘉欢助理教授与彭宇新教授合作在人工智能重要国际期刊 IEEE TPAMI 发布一项最新的研究成果：DKP++（Distribution-aware Knowledge
阅读全文
AI视频进入蒸汽机时代
作者：机器之心发布日期：2025-09-25 23:14:35
机器之心报道机器之心编辑部AI 视频生成行业天花板再次被拉高。百度杀入 AI 视频生成赛道后，就一直加班加点卷个不停。7 月初，百度第一次正式官宣蒸汽机 1.0 模型，以极致指令遵循能力惊艳亮相；8
阅读全文
高通祭出全球最快移动SoC！卢伟冰携全球首发小米17Pro现身
作者：机器之心发布日期：2025-09-25 23:14:35
机器之心报道编辑：杜伟今天上午，在古北水镇举办的 2025 骁龙峰会·中国会场，高通最新、最强、最快的移动旗舰 SoC 正式问世！本代 SoC 被命名为「第五代骁龙 8 至尊版移动平台」（骁龙 8 E
阅读全文
给几何图片写标题就能让AI更聪明，UIUC发布高质量可泛化几何数据集
作者：机器之心发布日期：2025-09-25 23:14:35
随着多模态大语言模型（MLLMs）在视觉问答、图像描述等任务中的广泛应用，其推理能力尤其是数学几何问题的解决能力，逐渐成为研究热点。然而，现有方法大多依赖模板生成图像 - 文本对，泛化能力有限，且视觉
阅读全文
数智赋能：建筑地产行业的转型突围与未来筑造
作者：机器之心发布日期：2025-09-24 15:45:14
机器之心发布机器之心编辑部作为人类文明的基石产业，建筑地产行业既是全球经济的核心支柱，更在时代浪潮中展现出强劲韧性：全球供应链重组催生人口流动红利，为核心区域注入持续开发需求；人口结构变迁与远程办公浪
阅读全文
AI4S新势力齐聚「SAIS Talk上智院星辰之夜」：五大前沿分享，等你来听
作者：机器之心发布日期：2025-09-24 15:45:14
机器之心发布机器之心编辑部在全球人工智能浪潮奔涌向前的当下，创新的核心驱动力正越来越多地来自年轻一代。他们敢于挑战前沿、不惧失败，正以跨界融合之姿重新定义科学发现的范式。作为长期关注科学智能（AI f
阅读全文
对抗协作+原型学习！深北莫FedPall开源，联邦学习破局特征漂移，准确率登顶SOTA
作者：机器之心发布日期：2025-09-24 15:45:14
本论文第一作者张勇为北京理工大学医学技术学院计算机技术专业硕士生，主要研究方向为联邦学习，多专家大模型，多任务学习和并行代理。通讯作者是深圳北理莫斯科大学人工智能研究院梁锋博士和胡希平教授。梁锋博士毕
阅读全文