CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架
本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团
阅读全文本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团
阅读全文选自quantamagazine作者: Joseph Howlett机器之心编译三百多年前,数学家费马在书页边缘留下了一个看似简单却困扰了学者几个世纪的难题——费马大定理。1994 年,Andrew
阅读全文本文主要作者是吕昂和谢若冰。吕昂,中国人民大学博士生,研究方向为语言模型结构优化,导师为严睿教授;谢若冰,腾讯高级研究员,研究方向为大语言模型、推荐系统。最近的一篇论文中,来自人大和腾讯的研究者们的研
阅读全文该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。大语言模型受限于固定上下文窗口,长期对话中「失忆」、记忆断裂等问题频发,北邮
阅读全文机器之心原创作者:张倩恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是
阅读全文机器之心报道编辑:杨文迄今为止行业最大的开源力度。在大模型上向来低调的小红书,昨天开源了首个自研大模型。该模型名为 dots.llm1,是小红书 hi lab(Humane Intelligence
阅读全文本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。该研究基于团队前期发布的 8B 扩
阅读全文本文作者分别来自西安交通大学、马萨诸塞大学阿默斯特分校、武汉大学以及南洋理工大学。第一作者张笑宇是来自西安交通大学的博士生,研究方向聚焦于大模型安全以及软件安全。通讯作者为西安交通大学沈超教授。在人工
阅读全文机器之心报道编辑:杜伟AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。一晃 2025 年已经快要过半了!AI 领域依然「热闹非凡」,令人目不暇接。年初爆火的 DeepSeek
阅读全文机器之心发布机器之心编辑部在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE
阅读全文DeepSeek-R1 爆火后,类 R1 的结果奖励训练范式在各领域掀起了推理热潮。基于规则的结果奖励实现简单、判断严格。但是,这真的够了吗? 在推理任务中,如果我们只是用「结果对错」来奖励模型,那模
阅读全文机器之心发布机器之心编辑部大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?华为诺亚方舟实验
阅读全文2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,4位图灵奖获得者演讲,30余位AI企业创始人&CEO分享,100余位全球青年科学家报告,两天会议将密集开展180余场人工智能主
阅读全文本研究由广州趣丸科技团队完成,团队长期致力于 AI 驱动的虚拟人生成与交互技术,相关成果已应用于游戏、影视及社交场景。趣丸科技团队提出了一种新颖的肖像驱动框架 Playmate,该算法能够根据音频和各
阅读全文机器之心报道编辑:陈陈、杜伟不得不感慨,陶哲轩真闲不住啊!昨天,他还在惊叹于谷歌 DeepMind AlphaEvolve 对解决人类数学问题(比如和差集问题)起到的加速作用。更早的时候,他还开通了油
阅读全文机器之心报道编辑:张倩「尽管经过 SFT 的模型可能看起来在进行推理,但它们的行为更接近于模式模仿 —— 一种缺乏泛化推理能力的伪推理形式。」随着 OpenAI 的 o1/o3 和 Deepseek-
阅读全文本文由 NUS ShowLab 主导完成。第一作者宋亦仁为新加坡国立大学 ShowLab@NUS 在读博士生,研究方向是视觉生成和多模态,在 CVPR、SIGGRAPH、NeurIPS 等国际顶级会议
阅读全文本文作者主要来自 Meta 和多所美国高校。第一作者是佐治亚理工机器学习专业的博士生赖柏霖(目前也是 UIUC 的访问学生),导师为 James Rehg 教授(已转入 UIUC),主要研究方向是多模
阅读全文机器之心发布机器之心编辑部孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。同样,对于大模型,我们也希望其面对简单问题时能减少思考内容,快速输出答案
阅读全文机器之心报道机器之心编辑部网友笑称: Hugging Face开源的机器人看起来不太聪明。伊隆・马斯克曾预测称到 2040 年,全球将有 100 亿台人形机器人在工作,而现在,随着 Hugging F
阅读全文机器之心报道编辑:Panda当状态空间模型遇上扩散模型,对世界模型意味着什么?在这个 AI 技术与应用大爆发的时代,我们最不缺的就是「热词」,从自回归到扩散模型,从注意力机制到状态空间模型,从思维链到
阅读全文「知其然,亦知其所以然。」这句儒家命题强调,真正的理解不仅在于结果,更在于推理过程。如今,在大型语言模型的后训练阶段,奖励模型承担着桥接模型行为与人类价值的重要职责;但现有模型往往只给出一个分数,却难
阅读全文机器之心发布机器之心编辑部Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE
阅读全文机器之心报道编辑:+0又有一个 AI Scientist 的论文通过了顶会同行评审。今天,Intology 宣布他们的 AI 科学家 Zochi 的论文被顶会 ACL 主会录用,成为首个独立通过 A*
阅读全文本文作者来自通义实验室和北京大学,第一作者是北京大学智能学院博士生孙浩,主要研究方向是RAG和Agent,在 NeurIPS、ACL、EMNLP 等国际顶级会议上发表多篇论文,师从张岩教授。该工作在阿
阅读全文本文共同第一作者为新加坡国立大学博士生铁宸睿和多伦多大学研究助理/本科生孙圣翔。合作者为朱锦轩、刘益伟、郭京翔、胡越、陈浩楠、陈俊廷、吴睿海。通讯作者为新加坡国立大学计算机学院助理教授邵林,研究方向为
阅读全文机器之心发布机器之心编辑部当前,混合专家模型(Mixture of Experts, MoE)在大型语言模型中的兴起,使得以较小的计算开销换取更大能力成为可能。然而,传统 MoE 普遍存在专家激活频次
阅读全文机器之心报道编辑:泽南、+0我们训练了这么久,都在训练些什么?这是今年最「好笑」的一篇论文。本文一出,所有的大语言模型(LLM)+ 强化学习(RL)都要被质疑是否有意义了。这周二,一篇来自华盛顿大学、
阅读全文深圳大学黄惠团队独立推出 CLR-Wire:连续潜空间驱动的三维曲线框生成方法,首次实现了将复杂的三维曲线框结构统一编码到连续的潜空间中,解决了传统方法难以同时有效捕捉线框几何和拓扑信息的难题。这一创
阅读全文机器之心报道编辑:Panda大模型越来越聪明,企业却似乎越来越焦虑了。模型性能突飞猛进,从写文案到搭智能体(Agent),AI 掌握的技能也越来越多。但一到真正上线部署,问题就来了:为什么推理成本越来
阅读全文