第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
机器之心报道作者:蛋酱国产 AI 领域,从今天起有了既能深度研究又能动手操作的自主智能体产品。这款神器叫做「AutoGLM 沉思」,来自中国公司智谱。我们来看一个非常经典的案例:只需要输出你想讨论的话
阅读全文机器之心报道作者:蛋酱国产 AI 领域,从今天起有了既能深度研究又能动手操作的自主智能体产品。这款神器叫做「AutoGLM 沉思」,来自中国公司智谱。我们来看一个非常经典的案例:只需要输出你想讨论的话
阅读全文机器之心报道机器之心编辑部最近超火的氛围编程(Vibe coding)你听说了吗?这个概念是由 AI 大神 Andrej Karpathy 提出的,用户只需要自然语言描述,就能生成代码。仅仅过去一个多
阅读全文论文有三位共同一作。赵若雯,清华大学一年级硕士生,主要研究生成模型、强化学习和具身智能,已在ICRA等会议发表论文。叶俊良,清华大学二年级硕士生,专注于3D生成和基于人类偏好的多模态强化学习研究,曾以
阅读全文机器之心报道编辑:大盘鸡、杜伟这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。吉卜力风格的图像和视频在社交圈疯传,被玩出了花。之心用 GPT-4o 和可灵做出了吉卜
阅读全文机器之心报道编辑:陈萍现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。最近,AI 公司 Databricks 推出了一种新的调优方法 TAO,只需要输入数据,无需标注数据
阅读全文作者是香港大学俞益洲教授与博士生娄蒙。你是否注意过人类观察世界的独特方式?当面对复杂场景时,我们往往先快速获得整体印象,再聚焦关键细节。这种「纵观全局 - 聚焦细节(Overview-first-Lo
阅读全文EmoEdit 由深圳大学可视计算研究中心黄惠教授课题组完成,第一作者为杨景媛助理教授。深圳大学可视计算研究中心(VCC)以计算机图形学、计算机视觉、人机交互、机器学习、具身智能、可视化和可视分析为学
阅读全文机器之心报道编辑:佳琪、泽南如今爆火的生成式 AI 领域里,先进的技术层出不穷,但能实现研发、收入齐头并进的公司还真不算多。不过就在本周四,「AIGC 第一股」出门问问发布了 2024 年度报告,其成
阅读全文机器之心报道编辑:张倩这应该是科技造福人类最直观的案例了。还记得那个凭借 Neuralink 脑机接口玩《马里奥赛车》、《文明六》的瘫痪患者 Noland Arbaugh 吗?刚刚,他更新了生活近况:
阅读全文论文第一作者为余鑫,香港大学三年级博士生,通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用,发表计算机视觉和图形学顶级会议期刊论文数十篇,论文数次获得 Oral, Sp
阅读全文机器之心报道机器之心编辑部2025 开年,DeepSeek-R1 的成功在全球掀起了一股开源风潮,上个月的开源周更是毫无保留地将自己的多项核心技术开放给了全球开发者。这种「完整技术栈」式的开源震撼了整
阅读全文机器之心报道编辑:陈陈、+0AI的脑洞日记我们经常听说,AI 就像一个无法破解的黑匣子。语言被输入进来,又被输出出去。没有人知道 AI 为什么会这样做。刚刚,AI 公司 Anthropic 公布了大模
阅读全文近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视
阅读全文机器之心报道机器之心编辑部他们都是来自全球的年轻 AI 学术新星。刚刚,苹果机器学习研究中心(Apple Machine Learning Research)正式公布了 2025 年 AI(人工智能)
阅读全文机器之心报道作者:泽南构建机器人的「眼睛」和「大脑」,vivo 其实早有准备。下一场科技浪潮已经开始了。刚过去不久的「AI 超级碗」英伟达 GTC 大会上,黄仁勋把「物理 AI」放在了 AI 发展的最
阅读全文机器之心报道机器之心编辑部OpenAI 也开始支持 MCP 了。这条消息由奥特曼亲自官宣:「人们非常喜欢 MCP,我们也很高兴在我们的产品中增加对它的支持。今天我们已经在 Agent SDK 中支持
阅读全文家人们震惊了!现在 AI 成精啦,不仅能写能画,现在连唱功都是格莱美级的了!魅惑空灵电音女声,也太好听了吧!酷佬街头说唱,怎么有一股八方来财的味儿?强混嘹亮欧美女高,像极了阿黛尔~极端的金属核嗓也不在
阅读全文机器之心报道作者:杜伟、佳琪2025 年第一款现象级的 AI 音乐爆品,就这么华丽丽地来了!国产大模型在技术实力上,又一次站在了世界前沿。3 月 26 日,国内「All in AGI 与 AIGC」
阅读全文机器之心报道作者:佳琳、佳琪谷歌有史以来最智能的 AI 模型。深夜悄悄搞事情的不只 OpenAI,抢在 OpenAI 开直播之前,谷歌上线了最强大的推理模型 Gemini 2.5 Pro。谷歌 CE
阅读全文该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬,以及财跃星辰白祚
阅读全文机器之心发布机器之心编辑部从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。3D 结构不仅承载着丰富的物理与化学信息,也可为科学家提供解构复杂系统
阅读全文机器之心报道编辑:Panda在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:根据视频中本车的动作,它接下来最有可能立即采取的行动是什么?A:右转,B:左转
阅读全文本文的主要作者来自北京航空航天大学、清华大学和中国人民大学。本文的第一作者为清华大学硕士生封皓然,共同第一作者暨项目负责人为北京航空航天大学硕士生黄泽桓,团队主要研究方向为计算机视觉与生成式人工智能。
阅读全文机器之心报道编辑:Panda、张倩在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然
阅读全文机器之心报道编辑:张倩、Panda训练狗时不仅要让它知对错,还要给予差异较大的、不同的奖励诱导,设计 RLHF 的奖励模型时也是一样。我们知道,一个 RLHF 算法是否成功的一大关键在于其奖励模型(R
阅读全文机器之心报道编辑:陈陈、蛋酱好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。刚刚,谷歌发言人 Alex Joseph 在给 The Verge
阅读全文3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。具体而言,给定一个 3D 场景和一
阅读全文选自 supaiku.com作者:Spike Doanz机器之心编译「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。作者认为,Transformers 中实现的注意力机制
阅读全文机器之心报道编辑:Panda强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关
阅读全文机器之心报道编辑:Panda我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?在与他人互动时,我应培养和运用同理心和
阅读全文