全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

    作者:机器之心发布日期:2025-05-20 12:58:06

    2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布

    阅读全文
  • 文章封面

    AI大厦需要新的地基!

    作者:机器之心发布日期:2025-05-19 12:03:19

    机器之心报道编辑:Panda「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了,正如前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 202

    阅读全文
  • 文章封面

    Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

    作者:机器之心发布日期:2025-05-19 12:03:19

    B 站开源动画视频生成模型 Index-AniSora,支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成!论文标题:AniSora: Exploring t

    阅读全文
  • 文章封面

    AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

    作者:机器之心发布日期:2025-05-19 12:03:19

    本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。当前文本生成视频(T2V)技术正在从注重视觉质量

    阅读全文
  • 文章封面

    刚刚!北大校友Lilian Weng最新博客来了:Why We Think

    作者:机器之心发布日期:2025-05-18 12:25:23

    选自 Lil'Log作者: Lilian Weng 机器之心编译学习大模型的优质博客又更新了!最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长

    阅读全文
  • 文章封面

    ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

    作者:机器之心发布日期:2025-05-18 12:25:23

    本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生,本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。对抗净化旨在测试阶段将对抗图像还原为其

    阅读全文
  • 文章封面

    ICML 2025|如何凭「自动补全」实现100K生成3×加速?

    作者:机器之心发布日期:2025-05-18 12:25:23

    在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。随着 GPT-o3, DeepSeek R1 等具备 「超级上下文窗口」 能力的大模型持续刷新业界记

    阅读全文
  • 文章封面

    刚刚,OpenAI最强编程智能体上线ChatGPT

    作者:机器之心发布日期:2025-05-17 00:31:13

    机器之心报道机器之心编辑部从编程开始,今年智能体要卷飞了!!!昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入

    阅读全文
  • 文章封面

    85倍速度碾压:苹果开源FastVLM,能在iphone直接运行的视觉语言模型

    作者:机器之心发布日期:2025-05-17 00:31:13

    机器之心报道作者:+0、刘欣FastVLM—— 让苹果手机拥有极速视觉理解能力当你用苹果手机随手拍图问 AI:「这是什么?」,背后的 FastVLM 模型正在默默解码。最近,苹果开源了一个能在 iPh

    阅读全文
  • 文章封面

    ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%

    作者:机器之心发布日期:2025-05-17 00:31:13

    该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。近些年,多模态大语言模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs 通

    阅读全文
  • 文章封面

    刚刚,Manus生图功能强势登场!从设计到搭建网站一站式搞定,1000积分免费薅

    作者:机器之心发布日期:2025-05-16 12:39:15

    机器之心报道编辑:陈陈、杜伟那个曾经一码难求的 Manus 已经可以全面注册了。从此以后,到处求购邀请码的时代一去不复回。首次注册就送「1000 积分」让你尝尝鲜!不得不说,Manus 这次真是豪气了

    阅读全文
  • 文章封面

    一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

    作者:机器之心发布日期:2025-05-16 12:39:15

    机器之心报道编辑:刘欣、+0最近,Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环

    阅读全文
  • 文章封面

    泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

    作者:机器之心发布日期:2025-05-16 12:39:15

    随着大模型(LLMs)的快速发展和可集成工具的爆炸增长,AI 智能助手在日常生活中可提供的便利越来越多,不仅包括传统任务型对话中订机票、查询天气等助理能力,还增加了无以计数的 AI 能力,如 AI 画

    阅读全文
  • 文章封面

    超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

    作者:机器之心发布日期:2025-05-15 14:04:07

    机器之心报道编辑:杜伟、陈陈国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外

    阅读全文
  • 文章封面

    刚刚,DeepMind通用科学智能体AlphaEvolve突破数学极限,陶哲轩合作参与

    作者:机器之心发布日期:2025-05-15 14:04:07

    机器之心报道编辑:+0、刘欣今天,DeepMind 正式发布了 AlphaEvolve —— 一个由 LLMs 驱动的革命性进化编码智能体。它不仅仅是一个代码生成工具,更是一个能够演化整个代码库,用于

    阅读全文
  • 文章封面

    ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题

    作者:机器之心发布日期:2025-05-15 14:04:07

    作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。本文提出一个交替「推理 - 擦除」的

    阅读全文
  • 文章封面

    字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

    作者:机器之心发布日期:2025-05-14 12:36:17

    机器之心报道编辑:杨文字节拿出了国际顶尖水平的视觉–语言多模态大模型。5 月 13 日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了 5 款模型和产品,包括豆包・视频生成模

    阅读全文
  • 文章封面

    叶子豪、陈天奇等人开源项目FlashInfer入选,MLSys2025最佳论文奖公布

    作者:机器之心发布日期:2025-05-14 12:36:17

    机器之心报道编辑:泽南、+0今年的两篇最佳论文一作均为华人。近日,国际系统领域顶会 MLSys 2025 公布了最佳论文奖。今年的大奖颁发给了来自华盛顿大学、英伟达、Perplexity AI、卡耐基

    阅读全文
  • 文章封面

    ICML 2025 | 如何在合成文本数据时避免模型崩溃?

    作者:机器之心发布日期:2025-05-14 12:36:17

    随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。然而,这一趋势也带来了严峻挑战:合

    阅读全文
  • 文章封面

    生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界

    作者:机器之心发布日期:2025-05-13 10:37:07

    机器之心报道作者:张倩、泽南世界模型的进度条,最近坐上了火箭。去年 11 月,两家创业公司打造的 Oasis,首次在开源世界模型中实现了实时、可玩、可交互。生成的虚拟环境不仅包含画面,也体现出了对物理

    阅读全文
  • 文章封面

    NYU教授公布2025机器学习课程大纲:所有人都在追LLM,高校为何死磕基础理论?

    作者:机器之心发布日期:2025-05-13 10:37:07

    机器之心报道编辑:+0最近,Meta 公司首席 AI 科学家、图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子:内容是关于这位教授 2025 学年机器学习研究生

    阅读全文
  • 文章封面

    突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道

    作者:机器之心发布日期:2025-05-13 10:37:07

    本文由来自香港城市大学、麦吉尔大学(McGill)、蒙特利尔人工智能实验室(MILA)、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多

    阅读全文
  • 文章封面

    强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

    作者:机器之心发布日期:2025-05-12 12:31:47

    机器之心报道编辑:杜伟递归思考 + 自我批判,CoRT 能带来 LLM 推理力的飞跃吗?CoT(Chain-of-thought)大家都很熟悉了,通过模仿「人类解题思路」,进而大幅提升语言模型的推理能

    阅读全文
  • 文章封面

    RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

    作者:机器之心发布日期:2025-05-12 12:31:47

    机器之心发布机器之心编辑部多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,

    阅读全文
  • 文章封面

    CMU朱俊彦等上新LEGOGPT,一句话就能搭乐高,网友:复杂零件行不行?

    作者:机器之心发布日期:2025-05-12 12:31:47

    机器之心报道机器之心编辑部AI 不允许有人不会搭乐高。近日,CMU 助理教授朱俊彦团队带来了新研究 —— 基于文本生成 3D 乐高的大模型。这款大模型有多强呢?比如输入文本「基本款沙发」,一眨眼的功夫

    阅读全文
  • 文章封面

    CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

    作者:机器之心发布日期:2025-05-12 12:31:47

    本文由中国科学院计算技术研究所研究团队完成,第一作者为硕士生杨晗,通讯作者为副研究员安竹林,助理研究员杨传广。论文标题:Multi-party Collaborative Attention Cont

    阅读全文
  • 文章封面

    Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频

    作者:机器之心发布日期:2025-05-11 11:20:53

    机器之心报道编辑:杜伟、大盘鸡本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。在项目中

    阅读全文
  • 文章封面

    现在的大学生,不用大模型才是异类

    作者:机器之心发布日期:2025-05-11 11:20:53

    选自New York Magazine机器之心编译作者:James D. Walsh「大学现在学的就是掌握 ChatGPT 的程度了。」在北美的顶尖大学校园里,人工智能完成作业、写论文已经成为一种常态

    阅读全文
  • 文章封面

    转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性

    作者:机器之心发布日期:2025-05-11 11:20:53

    本文一作为肖泽琪,本科毕业于浙江大学,现为南洋理工大学博士生,研究方向是基于视频生成模型的世界生成和模拟,导师为潘新钢。个人主页:https://xizaoqu.github.io近年来,基于视频生成

    阅读全文
  • 文章封面

    SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

    作者:机器之心发布日期:2025-05-11 11:20:53

    Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而,我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的

    阅读全文
上一页下一页