全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位

    作者:机器之心发布日期:2025-03-24 12:34:44

    3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。具体而言,给定一个 3D 场景和一

    阅读全文
  • 文章封面

    「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

    作者:机器之心发布日期:2025-03-23 12:01:27

    选自 supaiku.com作者:Spike Doanz机器之心编译「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。作者认为,Transformers 中实现的注意力机制

    阅读全文
  • 文章封面

    田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

    作者:机器之心发布日期:2025-03-23 12:01:27

    机器之心报道编辑:Panda强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关

    阅读全文
  • 文章封面

    用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

    作者:机器之心发布日期:2025-03-23 12:01:27

    机器之心报道编辑:Panda我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?在与他人互动时,我应培养和运用同理心和

    阅读全文
  • 文章封面

    地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

    作者:机器之心发布日期:2025-03-23 12:01:27

    OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。而在自动驾驶,近年来端到端模型大幅提升了规划控车的效

    阅读全文
  • 文章封面

    揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

    作者:机器之心发布日期:2025-03-22 12:00:59

    机器之心报道机器之心编辑部其实大模型在DeepSeek-V3时期就已经「顿悟」了?DeepSeek-V3-Base 在强化学习(RL)调优之前就已经展现出「顿悟时刻」?RL 调整中不断增加的输出长度可

    阅读全文
  • 文章封面

    强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

    作者:机器之心发布日期:2025-03-22 12:00:59

    机器之心报道机器之心编辑部虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人

    阅读全文
  • 文章封面

    CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

    作者:机器之心发布日期:2025-03-22 12:00:59

    在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。终于,近期由来自南京大学、中科院、清华大学、

    阅读全文
  • 文章封面

    ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen

    作者:机器之心发布日期:2025-03-22 12:00:59

    第一作者卢昊飞、第二作者吴哲,分别为清华大学计算机系在读硕士与博士研究生。通讯作者兴军亮教授长期致力于感知与博弈决策的理论与应用研究,在多智能体系统、强化学习及智能决策等领域取得了一系列重要成果。最近

    阅读全文
  • 文章封面

    13年后,AlexNet源代码终于公开:带注释的原版

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心报道编辑:张倩、泽南从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷

    阅读全文
  • 文章封面

    前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心发布机器之心编辑部近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能

    阅读全文
  • 文章封面

    Roblox发布3D智能基础模型Cube,一句话生成游戏资产

    作者:机器之心发布日期:2025-03-21 12:09:48

    机器之心报道编辑:2049、PandaRoblox,这个备受青少年喜爱的在线游戏平台,正通过引入 AI 技术,进一步革新游戏的创作体验。据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox 允许用

    阅读全文
  • 文章封面

    树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架

    作者:机器之心发布日期:2025-03-21 12:09:48

    通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏,以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜

    阅读全文
  • 文章封面

    波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道编辑:Panda、蛋酱波士顿动力Atlas不语,只是一味双手撑地翻跟斗。昨天,宇树机器人发布了一段视频,宣布首次让人形机器人实现了侧空翻,吸睛无数。而就在这段视频发出后不到 12 小时,波

    阅读全文
  • 文章封面

    一个算法让LLM创新能力暴增,原来是AI学会了进化

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道编辑:Panda如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整

    阅读全文
  • 文章封面

    李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

    作者:机器之心发布日期:2025-03-20 14:06:26

    机器之心报道机器之心编辑部当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含

    阅读全文
  • 文章封面

    华为诺亚综述:生成式模型如何用于决策?

    作者:机器之心发布日期:2025-03-20 14:06:26

    机构:华为诺亚决策推理实验室作者:李银川、郝建业等人近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。由于生成模型能够处理复杂的数据分布,并具备强大的建模能力

    阅读全文
  • 文章封面

    专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍

    作者:机器之心发布日期:2025-03-19 05:35:49

    机器之心报道机器之心编辑部Token is the new frontier.「因为 AI 技术爆发,GTC 大会的规模每年都在扩大,以前人们说 GTC 是 AI 的伍德斯托克音乐节,今年我们搬进了体

    阅读全文
  • 文章封面

    Django创造者Simon Willison分享:我如何使用LLM帮我写代码

    作者:机器之心发布日期:2025-03-19 05:35:49

    选自simonwillison.net作者:Simon Willison机器之心编辑部近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领

    阅读全文
  • 文章封面

    世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP

    作者:机器之心发布日期:2025-03-19 05:35:49

    本文的作者均来自新加坡国立大学 LinS Lab。本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。本文的通讯作者为新加

    阅读全文
  • 文章封面

    无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

    作者:机器之心发布日期:2025-03-19 05:35:49

    LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。通讯作者为香港科技大学助理教授 Har

    阅读全文
  • 文章封面

    多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

    作者:机器之心发布日期:2025-03-18 15:35:09

    机器之心报道编辑:杜伟、泽南DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领

    阅读全文
  • 文章封面

    单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

    作者:机器之心发布日期:2025-03-18 15:35:09

    机器之心报道编辑:张倩多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。小模型正在变得越来越好,而且越来越便宜。刚刚,法国 AI 创企

    阅读全文
  • 文章封面

    本地也能运行Deep Research!支持arXiv平台,兼容PDF、Markdown等

    作者:机器之心发布日期:2025-03-18 15:35:09

    机器之心报道编辑:陈陈今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解答

    阅读全文
  • 文章封面

    深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述

    作者:机器之心发布日期:2025-03-18 15:35:09

    本文作者来自香港科技大学、香港科技大学(广州)、香港城市大学以及UIUC等机构。其中,港科大在读博士生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者;林熙博士目前担任港城大博士后

    阅读全文
  • 文章封面

    不是CG?没加速?这个国产机器人跳「斧头帮」舞火了,网友:流畅到不像真的

    作者:机器之心发布日期:2025-03-17 12:45:09

    机器之心报道编辑:张倩、佳琳灵活到像 CG,官方却说是一倍速实拍,国产机器人又整活了。自打国产人形机器人在春晚扭秧歌出圈后,它们在「斗舞」这个赛道是越走越远了。图中的机器人来自众擎,名叫 PM01。它

    阅读全文
  • 文章封面

    真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

    作者:机器之心发布日期:2025-03-17 12:45:09

    机器之心编译编辑:江龙最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。2025 年 1 月,OpenAI 发布了名为 DeepResearch 的 o3 模型变种,专门用于网页和文档

    阅读全文
  • 文章封面

    北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

    作者:机器之心发布日期:2025-03-17 12:45:09

    机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列

    阅读全文
  • 文章封面

    大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里

    作者:机器之心发布日期:2025-03-17 12:45:09

    王鑫涛,复旦大学博士生,师从肖仰华、汪卫教授,致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术,在AI角色扮演领域发表多篇ACL/EMNLP论文,以及该领域首篇研究综述,

    阅读全文
  • 文章封面

    提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人

    作者:机器之心发布日期:2025-03-16 12:18:42

    机器之心原创编辑:陈陈、杨文AI 竞争进入白热化阶段。这次,轮到百度给自家大模型上强度。刚刚,百度一口气官宣了两款大模型,分别是文心大模型 X1 和文心大模型 4.5。那么,这两款大模型有啥区别呢?这

    阅读全文
上一页下一页