高阶程序,让AI从技术可行到商业可信的最后一公里
机器之心报道编辑:Panda很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI
阅读全文机器之心报道编辑:Panda很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI
阅读全文机器之心发布机器之心编辑部近日,全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕,共 3 篇论文获奖,华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果,获
阅读全文近年来,以人形机器人、自动驾驶为代表的具身人工智能(Embodied Artificial Intelligence, EAI)正以前所未有的速度发展,从数字世界大步迈向物理现实。然而,当一次错误的风
阅读全文机器之心发布机器之心编辑部让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。观众
阅读全文机器之心发布机器之心编辑部日前,在 2025 Inclusion・外滩大会上,蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力,致力于实现 A
阅读全文本文来自加州大学圣克鲁兹分校(UCSC)、苹果公司(Apple)与加州大学伯克利分校(UCB)的合作研究。第一作者刘彦青,本科毕业于浙江大学,现为UCSC博士生,研究方向包括多模态理解、视觉-语言预训
阅读全文机器之心报道编辑:杨文AI点餐时代来了?这一年,AI Agent 的热度一路走高。从大洋彼岸的 OpenAI、谷歌等 AI 巨头,到国内的各类创业公司,大家都在摸索如何让 AI 真正帮人干活。相比需要
阅读全文机器之心报道编辑:张倩只用 1.5% 的内存预算,性能就能超越使用完整 KV cache 的模型,这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路
阅读全文在大型语言模型(LLM)的浪潮下,多模态 AI 取得了飞速发展,尤其是在视觉语言(LVLM)领域,已经形成了成熟的研究范式。然而,与之形成鲜明对比的是,大型语音语言模型(LSLM)的发展却显得零散且步
阅读全文机器之心报道编辑:泽南、杨文与其他全开源模型相比,性能提升2-5倍。小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。本周五,Meta AI 团队正式发布了 MobileLLM-R1。H
阅读全文机器之心报道编辑:冷猫超高规格团队,重新审视RL推理领域发展策略。在人工智能的发展中,强化学习 (RL) 一直是一种非常重要的方法。自 1998 年 Sutton 提出强化学习概念以来,就明确了只要给
阅读全文数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而,现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大,无法实时响应,要么只能处理单一模态输入,
阅读全文机器之心报道编辑:张倩挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数
阅读全文机器之心报道机器之心编辑部好工具,才有好智能体。智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。为了让智能体真正释放潜力,我们需要重新
阅读全文图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。然而,当前学界和开源界的方案都面临着三大关键痛点:开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时
阅读全文机器之心报道机器之心编辑部真正的元凶是缺乏批次不变性。就在今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,
阅读全文机器之心报道机器之心编辑部AI 开发复杂软件的时代即将到来?近年来,以 Google 的 AlphaEvolve 为代表的研究已经证明,AI 智能体可以通过迭代来优化算法,甚至在某些小型、独立的编程任
阅读全文当人们还在惊叹大模型能写代码、能自动化办公时,它们正在悄然踏入一个更敏感、更危险的领域 —— 网络安全。想象一下,如果 AI 不只是写代码的助手,而是能够像「白帽黑客」一样,在不破坏系统的前提下模拟攻
阅读全文机器之心原创编辑:吴昕一场关于未来金融智能的集体预演,见证了创业者们的冲刺,也折射出一个行业的进化。2025 年的 AI ,正在上演「双线长跑」。一端是大模型底层的持续进化,远未触顶;另一端是场景应用
阅读全文机器之心报道编辑:+0、张倩想象一下,如果 ChatGPT 等 AI 大模型在生成的时候,能把自己不确定的地方都标记出来,你会不会对它们生成的答案放心很多?上周末,OpenAI 发的一篇论文引爆了社区
阅读全文打开手机,让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务,这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体,正在从科幻走进现实。然而,通往 “解放双手”
阅读全文机器之心报道机器之心编辑部当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。就在上周,OpenAI 的论文《Why Language Mode
阅读全文机器之心报道编辑:冷猫我们已经进入了大模型时代,越来越多的应用依赖大模型的能力,可以说大模型已经成为智能化基础设施的核心组成部分,支撑着语言,视觉分析,智能驾驶,机器人等各种下游应用。在大模型的实际使
阅读全文在当前由大语言模型(LLM)驱动的技术范式中,检索增强生成(RAG)已成为提升模型知识能力与缓解「幻觉」的核心技术。然而,现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限,具体挑战如下:表面
阅读全文机器之心原创作者:冷猫好玩好用的明星视频生成产品再更新,用户操作基础,模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域,纳米香蕉在短期内
阅读全文机器之心报道编辑:+0,冷猫经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。近期,Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架,旨
阅读全文在多模态大模型的基座上,视觉 - 语言 - 动作(Visual-Language-Action, VLA)模型使用大量机器人操作数据进行预训练,有望实现通用的具身操作能力。然而,现有 VLA 基座模型
阅读全文机器之心报道作者:Youli谁率先让模型拥有「记忆」,谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗?如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 Dee
阅读全文机器之心报道机器之心编辑部自 2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大,预训练
阅读全文近日,字节跳动 Seed 团队发布了最新的机器人研究成果——Robix,一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题:Robix: A Unified Model for Robo
阅读全文