世界模型开始做减法?LeCun团队和清华团队给出两种思路
机器之心编辑部近期,围绕「世界模型」这一方向,有两项工作受到较多关注。一篇是来自 Yann LeCun 团队的 LeWorldModel,尝试以更简洁的 JEPA 实现从像素端到端训练的世界模型,在降
阅读全文机器之心编辑部近期,围绕「世界模型」这一方向,有两项工作受到较多关注。一篇是来自 Yann LeCun 团队的 LeWorldModel,尝试以更简洁的 JEPA 实现从像素端到端训练的世界模型,在降
阅读全文从视频生成、机器人控制,到自动驾驶、GUI 智能体,再到科学发现,世界模型正在成为 AI 迈向「会想、会推演、会规划」的关键路线。它不再只是「看懂当下」,而是试图让模型学会在内部模拟世界如何演化,从而
阅读全文机器之心编译前些天,著名 AI 技术作家 Sebastian Raschka 发布了一份「LLM 架构画廊」,获得了 AI 社区的高度关注和赞扬,参阅《DeepSeek、GPT、Qwen,所有大模型架
阅读全文机器之心编辑部如果说 Meta 去年的关键词是「砸钱抢人」,今年可能是「为 AI 降本增效」。前两周,路透社援引知情人士消息称,Meta 正在酝酿大规模裁员,可能影响公司 20% 甚至更多员工。按照
阅读全文机构:北京大学人工智能研究院作者:刘晔玮,王希元,毛彦升,Yoav Gelberg,Haggai Maron,张牧涵我们提出了一种全新的超网络(Hypernetwork)架构:仅需一次前向传播,即可将
阅读全文机器之心编辑部这两年,扩散语言模型(Diffusion LLM)一直是个很有讨论度的方向。和传统自回归模型不同,扩散模型不是严格按从左到右一个 token 一个 token 往外吐,它在生成方式上更灵
阅读全文编辑|冷猫、杜伟马斯克,又踏出了迈向星际文明的关键一步!北京时间早上 8 点,马斯克在 X 上预告,将直播正式发布「TERAFAB」项目,它将由其旗下 SpaceX 和 Tesla 共同完成。该项目的
阅读全文在 AIGC 领域,基于参考图像的图像修复(Reference-based Inpainting)一直是一项备受关注的核心任务,它旨在利用参考图像引导修复过程,生成视觉一致的内容。这一技术在广告营销和
阅读全文编辑|张倩导读:黄仁勋刚在 GTC 上放话:Token 就是 AI 时代的新货币,谁能把每瓦特电力榨出更多高价值的 Token,谁就能称王。几乎同时,奖金池高达 600 万元的腾讯广告算法大赛开启报名
阅读全文机器之心编辑部今年 GTC 上英伟达「唯一」的消费级新技术,却在推出后引来了巨大争议。本周,英伟达公布了其最新的 AI 图像重建与超分辨率技术 DLSS 5,并称其为「自 2018 年实时光线追踪问世
阅读全文本文第一作者闫峻溪为清华大学 FAITH Lab 预科博士生,师从詹靖涛助理教授。FAITH Lab(Foundation of AI Lab at TsingHua)由詹靖涛教授创立,致力于探索人工
阅读全文编辑|Youli过去一年,全球科技界正开启一场关于「世界模型」的豪赌。从李飞飞 World Labs 的百亿美元估值神话,到 Yann LeCun 创下纪录的 10.3 亿美元种子轮,再到 Googl
阅读全文编译|冷猫你还在为你的龙虾笨笨的而烦恼吗?你还在为找不到合适的 Skills 安装而焦头烂额吗?你还在为网上找到的 Skills 可能不安全而心惊胆战吗?养了这么久龙虾,是时候开始构建自己的 Skil
阅读全文人类之所以能主宰地球,很大程度上归功于一项独特的认知能力——制造和使用工具。从石器时代的燧石刀到现代的精密仪器,工具的发明一直是衡量智能水平的核心标志。然而,当我们审视当今最前沿的机器人研究,会发现一
阅读全文机器之心编辑部是的,你没看错!昨晚,一场无真人出镜的全球直播引爆海外社区,引起了巨大轰动。这场直播的主讲者是一个中国 AI——「论论全球」(OALL),就在上周才发布了首个全球科学家社区。此次,它没有
阅读全文机器之心编辑部OpenAI 发起全新挑战:你,准备好迎战了吗?这次挑战,看起来有些反常识。参与者需要在固定的 FineWeb 数据集上尽可能降低验证损失,同时将模型产物(包含权重与训练代码)控制在 1
阅读全文当视频大模型在 MVBench、VideoMME 等离线基准上越跑越高分,真实交互场景却卡在两个硬问题:如何处理无界的视频流、如何让模型在动态的视频流中决定回答时机。近期,香港浸会大学联合腾讯优图实验
阅读全文编辑|Panda过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。然而,在这些技术繁荣的背后,行业正面临一个愈发核心的拷问:我
阅读全文天下苦 PPT 久矣。体验过市面上各种 AI 生成 PPT 工具的人,往往都会遇到同样的痛点:排版崩坏、内容空洞、经不起推敲。 为什么会这样?因为目前的通用大语言模型(LLM)写 PPT,本质上是在对
阅读全文编辑|张倩大公司工作过的人应该都深有体会,在引入新工具方面,他们有着一种「集体性迟疑」。这种迟疑并非保守,而是组织记忆的产物。1999 年,好时巧克力强行提速引入新企业管理工具,导致供应链瘫痪;201
阅读全文机器之心编辑部近日,世界模型与空间智能前沿公司魔芯科技已完成 Pre-A + 轮近亿元融资。本轮融资由华为哈勃领投,老股东跟投。成立于 2021 年的魔芯科技从 3D AI 物体建模和制造出发,正逐步
阅读全文该论文通讯作者为上海交通大学数学科学学院 / 人工智能学院陈洛南教授与西北工业大学自动化学院张绍武教授;第一作者为闫金铃与张弛浩;研究人员还包括史际帆与黄伟填。从观测时间序列数据中准确识别因果关系,是
阅读全文编辑|+0最近科技圈最火的话题,非「养龙虾」莫属。OpenClaw 横空出世,GitHub 星标增速超过 Linux,大厂门口安装服务排起千人长队,闲鱼上「代装龙虾」的生意被炒到高价。「你养龙虾了吗」
阅读全文机器之心报道最近几年,大模型赛道好不热闹。叫得上名字的几乎数都数不过来:从 GPT、Llama、Gemma、Mistral,到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等等,新模
阅读全文随着生成式 AI 迈入万亿参数时代,大语言模型(LLM)的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点(SuperNode)复杂的异构存储架构下,实现海量张量的高效管理和调度,已成为大模型落
阅读全文机器之心编辑部每次打开 arXiv 都能看到的那个「康奈尔大学」标识,很有可能将成为历史了。最近,arXiv 发布了一个官方信息,称「经过与康奈尔大学数十年富有成效的合作,并在西蒙斯基金会的支持下,a
阅读全文编辑|杜伟过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」之所以如此爆火,很大程度上归功于 OpenClaw 的长期记忆能力,它能够
阅读全文近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似
阅读全文机器之心编辑部Meta 的 AI 计划,突然踩了刹车。据《纽约时报》、路透社、彭博社等多家媒体报道,Meta 正在开发的新一代基础大模型 Avocado(牛油果),原本计划在本月发布,但由于性能未达预
阅读全文机器之心编辑部如果有一天,大模型不再依赖人类语言训练,会发生什么?过去几年,大模型能力的飞跃几乎都建立在一个前提之上:海量文本数据。互联网、书籍、代码、论文,几乎所有人类留下的语言痕迹,都被当作训练数
阅读全文