震撼,英伟达新模型能打遍几乎所有游戏
编辑|冷猫话不多说,先给大家看个视频。这流畅的游戏动作,简直堪比是技术流游戏玩家的实况画面。尤其是茶杯头的躲避跳跃踩灵魂一气呵成,让我们自愧不如。我要有这么快的反应和操作水准,玩丝之歌真不至于红温。最
阅读全文编辑|冷猫话不多说,先给大家看个视频。这流畅的游戏动作,简直堪比是技术流游戏玩家的实况画面。尤其是茶杯头的躲避跳跃踩灵魂一气呵成,让我们自愧不如。我要有这么快的反应和操作水准,玩丝之歌真不至于红温。最
阅读全文编辑|冷猫大模型的通用性和泛化性越来越强大了。虽说一些新模型,比如说「差评如潮」的 GPT-5.2,在专业任务和智能水平已经达到了非常出色的水平,但离我们所认知的 AGI 依旧十分遥远。不过,这也说明
阅读全文本研究的共同第一作者是来自于香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。你的生成模型真的「懂几何」吗?还是只是在假装
阅读全文该工作由上海人工智能实验室钟志航团队联合四川大学、东京大学、上海交通大学、西北工业大学共同完成。在李飞飞团队 WorldLabs 推出 Marble、引爆「世界模型(World Model)」热潮之后
阅读全文机器之心编辑部「出门在外,身份都是自己给的」。最近两天,一款名为《青椒模拟器》的小游戏突然火了,好玩程度一整个把人震撼住了。游戏时间以学年为单位推进。一开始,每个人的起点都差不多:职称未定、资源有限、
阅读全文机器之心编辑部近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到
阅读全文随着扩散模型(Diffusion Models)的迭代演进,图像生成已经日臻成熟。然而,在 多实例图像生成(Multi-Instance Image Generation, MIG) 这一有着大量用户
阅读全文编辑|Panda、泽南大模型的竞争如火如荼,也有一群人正在研究如何降低门槛,让 AI 工具变得亲民。最近,在 AI 基础算力上重磅频出的华为,又亮出了一张王牌:昇腾的底层基础软件,CANN 全面开源开
阅读全文机器之心编辑部混合专家(MoE)模型已成为在不显著增加计算成本的情况下,实现语言模型规模化扩展的事实标准架构。近期 MoE 模型展现出明显的高专家粒度(更小的专家中间层维度)和高稀疏性(在专家总数增加
阅读全文本文的第一作者雍希贤是来中国人民大学的博士生,研究方向聚焦于 Humanoid AI,LLM Coginition & Reasoning。通讯作者为中国人民大学的周骁副教授以及腾讯天衍实验室的吴贤。
阅读全文编辑|Youli年初,围绕着 2025 年将是「大模型落地应用元年」「AI Agent 元年」的共识,业界开始了大规模持续探索。如今临近年尾,回过头来看,从高度标准化的客服对话、代码生成到流程化文档处
阅读全文机器之心发布具身智能通往通用性的征途,正被 “数据荒漠” 所阻隔。当模型在模拟器中刷出高分,却在现实复杂场景中频频 “炸机” 时,行业开始反思:我们喂给机器人的数据,是否真的包含人类操作的精髓?近日,
阅读全文在计算机图形学、三维视觉、虚拟人、XR 领域,SIGGRAPH 是毫无争议的 “天花板级会议”。 SIGGRAPH Asia 作为 SIGGRAPH 系列两大主会之一,每年只接收全球最顶尖研究团队的成
阅读全文编辑|+02025 年即将画上句号,回望这一年的视频生成领域,用「突飞猛进」来形容毫不为过,甚至可以说,视频内容创作的范式正在悄然发生改变。9 月,OpenAI 发布的 Sora 2 凭借「客串(Ca
阅读全文机器之心发布12 月 17 日,在香港举办的全球图形学领域备受瞩目的顶级学术盛会 SIGGRAPH Asia 2025 上,摩尔线程在 3D Gaussian Splatting Reconstruc
阅读全文如今,以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务,而DeepSearch 作为深度思考大模型的核心搜索器,在推理过程中通过迭代调用外部搜索工具,访问参数边界之外的最新、领
阅读全文机器之心发布如果把用户在互联网上留下的每一个足迹都看作一段记忆,那么现在的推荐系统大多患有 “短期健忘症”。受限于算力和存储,那些沉睡在数年前的点击、收藏与购买,往往被粗暴地截断或遗忘。即便被召回,它
阅读全文机器之心发布通用大模型(LLM)的狂飙突进,终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE(美国执业医师资格考试)中表现优异,但在面对需要「火眼金睛」和「毫厘必争」
阅读全文本文共同第一作者为西安交通大学硕士生常建磊和博士生梅若风。柯炜为西安交通大学副教授。论文通讯作者为西安交通大学教授许翔宇,其研究方向涵盖三维视觉、生成式 AI 与具身智能(个人主页:https://x
阅读全文机器之心报道编辑:杨文自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成
阅读全文机器之心报道机器之心编辑部随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。一方面,真实世界评估成本极高,需要系统性地覆盖
阅读全文近日,在全球人工智能领域最具影响力的顶级学术会议 NeurIPS(神经信息处理系统大会)上, 清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对抗攻击生成框架。简单来说,Dual-Fl
阅读全文机器之心报道机器之心编辑部现在的大学生该选什么专业?未来一百年的大学会是什么样子?业界 AI 如此强势,学界还能做什么?谷歌在过去二十多年里做对了什么,又有哪些遗憾?在斯坦福大学工程学院百年庆典的收官
阅读全文机器之心报道编辑:张倩模型架构的重要性可能远超我们之前的认知。最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网络,即使在完全不同的数据集上训练、用不同的初始化和超参数,最终学到的权
阅读全文本文第一作者陈羽田,香港中文大学 MMLab 博士二年级在读,研究方向为三维重建与生成,导师为薛天帆教授。个人主页:https://yutian10.github.io当古装剧中的长袍在武林高手凌空翻
阅读全文机器之心报道编辑:杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业
阅读全文机器之心报道编辑:Panda邹忌曾经有一个问题:吾与徐公孰美?而对于 REPA,也有一个类似的问题:全局信息与空间结构,哪个对表征对齐更重要?表征对齐(REPA)可通过将强大的预训练视觉编码器的表征蒸
阅读全文多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言去推理?实际上,不同的语言在模型内部承载着不同的「特长」。比如英语可能逻辑性强,适合科学推
阅读全文机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有
阅读全文