苹果入局AI Pin,或对标OpenAI,能否打破「电子垃圾」魔咒?
机器之心编辑部近日,有消息传出,苹果正在研发一款由 AI 驱动的可穿戴「胸针」(Pin)设备,不过目前该设备仍处于早期研发阶段,最快可能也要在 2027 年才能面世。据知情人透露,该设备体积与 Air
阅读全文机器之心编辑部近日,有消息传出,苹果正在研发一款由 AI 驱动的可穿戴「胸针」(Pin)设备,不过目前该设备仍处于早期研发阶段,最快可能也要在 2027 年才能面世。据知情人透露,该设备体积与 Air
阅读全文编辑|冷猫谷歌 2017 年提出的 Transformer 架构事实上已经基本垄断了大模型。不采用 Transformer 架构的大模型已经是少之又少,而采用非 Transformer 架构,还能与主
阅读全文近日,中国科学技术大学(USTC)联合新疆师范大学、中关村人工智能研究院、香港理工大学,在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。相关成果于 2026 年 1 月 8 日以 “Dat
阅读全文编辑|泽南、杜伟在语音大模型赛道上,GPT-4o、Gemini 的能力遥遥领先。近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Di
阅读全文编辑|Panda一根 256 GB 内存条标价 5000 美元?这个价格已经轻松超过了英伟达顶配显卡 RTX 5090 的市场溢价。此推文引发了广泛讨论,已收获超 200 万浏览,图源:X@Yuche
阅读全文在迈向通用人工智能(AGI)的征途中,多模态大语言模型(MLLMs)虽然在视觉理解与文本生成上展现了惊人的能力,却始终面临一道难以逾越的鸿沟:如何在复杂的数学与几何推理中,克服固有的幻觉与逻辑断层?
阅读全文机器之心编译元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用
阅读全文机器之心编辑部开始前,温馨提醒一下各位投稿 ICML 2026 的小伙伴们,投稿已于 1 月 8 日开放,也请大家注意投稿截止时间:摘要提交截止日期:2026 年 1 月 23 日。全文提交截止日期:
阅读全文想象这样一个日常画面:你吩咐家用机器人「烧壶开水」,它却当场卡壳——水壶在哪?该接自来水还是过滤水?先插电还是先按开关?水开了又该如何判断?这些对人类而言像呼吸一样自然的家务,对过去的机器人却是大大的
阅读全文机器之心编译软件行业正站在一个颇为微妙的拐点上。AI 已经从自动补全代码,演进为能够自主执行开发任务的智能体。在这一变化之下,初级开发者和高级开发者正同时被推入各自不同、却同样棘手的困境之中。对初级开
阅读全文机器之心编辑部我们常问:AGI 什么时候到来?你有没有想过,可能它已经来了。最近,红杉资本合伙人 Pat Grady、Sonya Huang 联合发表了一篇博客,指出 AGI 已经到来,就在此刻。在他
阅读全文视频世界模型领域又迎来了新的突破!复旦大学与腾讯 PCG ARC Lab 等机构的研究者们提出了 VerseCrafter,这是一个通过显式 4D 几何控制(4D Geometric Control)
阅读全文编辑|泽南、杨文这一天终于还是来了。周六凌晨,OpenAI 的一则公告引起轩然大波:他们计划在 ChatGPT 里加广告了。对此,网友们感到很受伤。有人表示,现在大家用大模型的一个重要原因就是能够避免
阅读全文随着人工智能在代码以及图片生成方面日益成熟,越来越多的研究人员也开始关注 AI 模型在游戏领域中的表现。实际上,游戏在 AI 的发展早期就已经是一个重要的研究方向,许多前期研究聚焦在 Atari,星际
阅读全文从 GPT-4o 开启全能(Omni)交互时代至今,Speech LLM 虽然在拟人化和低延迟上取得了长足进步,但面临一个令人困扰的现象:当大语言模型(LLM)被赋予 “听觉” 后,它的智商下降了。即
阅读全文编辑|Panda、杨文临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大
阅读全文编辑|张倩继奥特曼在 OpenAI 的「宫斗」大戏后,他的老搭档 Mira 这周的经历也够拍一部电视剧了。昨天,我们报道了前 OpenAI CTO Mira Murati 创办的 Thinking M
阅读全文随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态(即 KV cache)
阅读全文编辑|杨文新年第一天,DeepSeek 发布了一篇艰深晦涩的技术论文,不少网友直呼「看不懂」。于是,机器之心评论区出现了集体求助 AI 的一幕:有人让 AI 用八十岁老太太能听懂的方式解释,有人要求用
阅读全文机器之心编辑部据机器之心求证,清华大学「姚班」校友、加州大学伯克利分校(UC Berkeley)助理教授陈立杰(Lijie Chen)已正式加入 OpenAI。知情人士透露,陈立杰此次是以全职身份加入
阅读全文尽管扩散模型(Diffusion Model)与流匹配(Flow Matching)已经把文本到图像生成(Text-to-Image, T2I)推向了更高的视觉质量与可控性,但他们通常在推理时需要数十
阅读全文编辑|张倩国内具身智能,接下来可能是「大脑」的战场了。2026 开年,自变量机器人传出融资消息,字节、红杉出手,融资额达到 10 亿。虽然自变量是一家软硬一体的公司,但这场融资背后,真正说服投资人的可
阅读全文编辑|+0站在 2026 年的开端回望,LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年,Transformer 架构以绝对的统治力横扫了人工智能领域,但随着算力成本的博弈和对推理效率的极致追求
阅读全文一个智能驾驶系统,在迈向高阶自动驾驶的过程中,应当具备何种能力?除了基础的感知、预测、规划、决策能力,如何对三维空间进行更深入的理解?如何具备包含法律法规、道德原则、防御性驾驶原则等知识?如何进行基本
阅读全文编辑|Panda假如你是一个致力于将 AI 引入传统行业的工程团队。现在,你有一个问题:训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊,更要能精准地识别图
阅读全文编辑 | 杜伟、泽南以人工智能技术闻名的 OpenAI,终于也要搞硬件了,而且一上来就是和苹果正面对标。最近,有关 OpenAI 硬件的消息越来越多。今天一早,数码博主 @智慧皮卡丘透露了关于 Ope
阅读全文“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”华为研究团队推出 SWE-Lego, 仅基于监督微调(SFT)的软
阅读全文编辑|Panda2024 年底,硅谷和北京的茶水间里都在讨论同一个令人不安的话题:Scaling Law 似乎正在撞墙。那时候,尽管英伟达的股价还在狂飙,但多方信源显示,包括彼时备受期待的 Orion
阅读全文01|“看懂世界” 这关,大模型还没上幼儿园过去一年,大模型在语言与文本推理上突飞猛进:论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是:当问题不再能 “用语言说
阅读全文