全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    One RL to See Them All?一个强化学习统一视觉-语言任务!

    作者:机器之心发布日期:2025-05-27 12:11:06

    机器之心报道编辑:+0、Panda强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是在目标检测 和目标定位等感知密集型任务中的应用,仍有待深

    阅读全文
  • 文章封面

    让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

    作者:机器之心发布日期:2025-05-27 12:11:06

    在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索,或编写/执行代码以操控图像,从而实现「图像中

    阅读全文
  • 文章封面

    北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

    作者:机器之心发布日期:2025-05-27 12:11:06

    随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最

    阅读全文
  • 文章封面

    惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

    作者:机器之心发布日期:2025-05-26 09:28:12

    机器之心原创编辑:杜伟国产智能体,这次真封神了。过去这段时间,「智能体」简直杀疯了。无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。作为人工智能的一种高

    阅读全文
  • 文章封面

    微软副总裁X上「开课」,连更关于RL的一切,LLM从业者必读

    作者:机器之心发布日期:2025-05-26 09:28:12

    选自𝕏作者:Nando de Freitas机器之心编译别人都在用 X 发帖子,分享新鲜事物,微软副总裁 Nando de Freitas 却有自己的想法:他要在 X 上「开课」,发布一些关于人工智能

    阅读全文
  • 文章封面

    ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道

    作者:机器之心发布日期:2025-05-26 09:28:12

    该工作由北京深度逻辑智能科技有限公司×宁波东方理工EIT-NLP实验室联合完成。语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进

    阅读全文
  • 文章封面

    50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

    作者:机器之心发布日期:2025-05-25 11:51:49

    选自量子杂志作者:Ben Brubaker机器之心编译相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵

    阅读全文
  • 文章封面

    只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

    作者:机器之心发布日期:2025-05-25 11:51:49

    机器之心报道编辑:Panda、+0近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是

    阅读全文
  • 文章封面

    312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

    作者:机器之心发布日期:2025-05-25 11:51:49

    自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算

    阅读全文
  • 文章封面

    60年前数学大师没解开的难题,被一位牛津博士生搞定了

    作者:机器之心发布日期:2025-05-24 11:13:22

    选自量子杂志作者:Leila Sloman机器之心编译加法,这项我们从幼儿园就掌握的运算,竟然蕴藏着未解之谜。 它是一项简单的运算:我们学到的第一个数学真理便是 1 加 1 等于 2。但加法能够产生的

    阅读全文
  • 文章封面

    40位数学家组成8队与o4-mini-medium比赛,6队败北

    作者:机器之心发布日期:2025-05-24 11:13:22

    机器之心报道编辑:Panda、陈陈最近,AI 在数学和编程上的能力飞跃令人瞠目结舌 —— 在不少任务上,它已经悄然超越了我们大多数人类。而当它面对真正的专家,会发生什么?Epoch AI 最近安排了一

    阅读全文
  • 文章封面

    矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%

    作者:机器之心发布日期:2025-05-24 11:13:22

    深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。论文标题:XXt Ca

    阅读全文
  • 文章封面

    DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

    作者:机器之心发布日期:2025-05-24 11:13:22

    选自Nathan Lambert博客机器之心编译作者:Nathan Lambert本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新

    阅读全文
  • 文章封面

    以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!

    作者:机器之心发布日期:2025-05-23 12:17:41

    机器之心发布机器之心编辑部现如今,随着参数规模的指数级增长,大语言模型(LLM)的能力边界不断被打破,AI 的智力正在经历快速跃迁。但随之而来的是,大模型在落地过程中面临着一系列推理层面的难题,比如推

    阅读全文
  • 文章封面

    四位图灵奖掌舵:2025智源大会揭示AI进化新路径

    作者:机器之心发布日期:2025-05-23 12:17:41

    2025 年 6 月 6-7 日中国,北京这个初夏四位图灵奖得主与全球创新力量共赴智源大会即刻报名,探寻 AI 时代的无尽边域2006 年,多伦多大学 Geoffrey Hinton 教授等人提出逐层

    阅读全文
  • 文章封面

    CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测

    作者:机器之心发布日期:2025-05-23 12:17:41

    论文第一作者林宏彬来自香港中文大学(深圳)理工学院的Deep Bit 实验室、深圳市未来智联网络研究院,导师为李镇老师。目前实验室的研究方向包括:自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

    阅读全文
  • 文章封面

    一场文心大模型的「AI马拉松」

    作者:机器之心发布日期:2025-05-22 18:25:25

    机器之心原创作者:张倩对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。2025 年,模型能力的重要性依然无需多言。从预训

    阅读全文
  • 文章封面

    帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

    作者:机器之心发布日期:2025-05-22 18:25:25

    机器之心发布机器之心编辑部在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。近日,华为数学家出手,祭出 FlashComm,三箭齐发,解决大模型推

    阅读全文
  • 文章封面

    性能碾压GPT-4.1-mini!Mistral开源Devstral,还能在笔记本上跑

    作者:机器之心发布日期:2025-05-22 18:25:25

    机器之心报道编辑:陈陈Devstral 是本地部署和设备端使用的理想之选。法国 AI 初创公司 Mistral 强势回归,再次大力投身开源 AI 社区。先前,其因未开源 Medium 3 大模型而受到

    阅读全文
  • 文章封面

    字节跳动&清华大学开源多模态时序大模型ChatTS,可实现时序数据对话与推理

    作者:机器之心发布日期:2025-05-22 18:25:25

    该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自

    阅读全文
  • 文章封面

    飞书一个聊天框,激活了机器之心编辑部的知识资产

    作者:机器之心发布日期:2025-05-21 12:00:31

    机器之心原创编辑:Panda、杨文你是否也有这样的经历:企业知识库像一座「屎山」,总是找不到想要的资料;找一份上周会议纪要像考古;忘了哪个群里发过一份超重要的文件;每次写汇报都像重新发明轮子……归根结

    阅读全文
  • 文章封面

    何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%

    作者:机器之心发布日期:2025-05-21 12:00:31

    机器之心报道编辑:陈萍这段时间,大神何恺明真是接连不断地发布新研究。这不,5 月 19 日,他又放出一篇新作!作者团队来自 CMU 以及 MIT。论文标题:Mean Flows for One-ste

    阅读全文
  • 文章封面

    策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

    作者:机器之心发布日期:2025-05-21 12:00:31

    金天,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。他主要研究机器学习与编程系统的结

    阅读全文
  • 文章封面

    75万元奖金池+心动offer,启元实验室2025重磅赛事来袭,三大赛道,等你来战!

    作者:机器之心发布日期:2025-05-20 12:58:06

    机器之心发布机器之心编辑部为推动智能算法从理论创新走向实际落地,启元实验室正式启动「启智杯」算法大赛。本届大赛聚焦「卫星遥感图像鲁棒实例分割」、「面向嵌入式平台的无人机对地目标检测」以及「面向多模态大

    阅读全文
  • 文章封面

    代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放

    作者:机器之心发布日期:2025-05-20 12:58:06

    机器之心发布机器之心编辑部检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 B

    阅读全文
  • 文章封面

    ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力

    作者:机器之心发布日期:2025-05-20 12:58:06

    「三个点电荷 + Q、-2Q 和 + 3Q 等距放置,哪个向量最能描述作用在 + Q 电荷上的净电力方向?」在解这道题时,我们可以通过绘制受力分析草图轻松解决。但即使是先进的多模态大语言模型,如 GP

    阅读全文
  • 文章封面

    ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

    作者:机器之心发布日期:2025-05-20 12:58:06

    2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布

    阅读全文
  • 文章封面

    AI大厦需要新的地基!

    作者:机器之心发布日期:2025-05-19 12:03:19

    机器之心报道编辑:Panda「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了,正如前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 202

    阅读全文
  • 文章封面

    Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

    作者:机器之心发布日期:2025-05-19 12:03:19

    B 站开源动画视频生成模型 Index-AniSora,支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成!论文标题:AniSora: Exploring t

    阅读全文
  • 文章封面

    AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

    作者:机器之心发布日期:2025-05-19 12:03:19

    本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。当前文本生成视频(T2V)技术正在从注重视觉质量

    阅读全文
上一页下一页