给你一群顶尖AI,如何组队才能发挥最大战力?UIUC用一个新的多智能体协作基准寻找答案
朱昆仑是伊利诺伊大学香槟分校(UIUC)计算机科学系的研究生,现隶属于Ulab与Blender Lab,曾在斯坦福大学、卡内基梅隆大学(CMU)与蒙特利尔学习算法研究所(Mila)进行学术访问。他的研
阅读全文朱昆仑是伊利诺伊大学香槟分校(UIUC)计算机科学系的研究生,现隶属于Ulab与Blender Lab,曾在斯坦福大学、卡内基梅隆大学(CMU)与蒙特利尔学习算法研究所(Mila)进行学术访问。他的研
阅读全文机器之心报道编辑:陈陈、笑寒线性循环模型(如 Mamba)和线性注意力机制都具备这样一个显著优势:它们能够处理极长的序列,这一能力对长上下文推理任务至关重要。事实上,这正是它们相较于 Transfor
阅读全文本文作者来自于清华大学和上海 AI Lab,通讯作者为清华大学丁宁助理教授和清华大学讲席教授、上海 AI Lab 主任周伯文教授。论文标题:MedXpertQA: Benchmarking Exper
阅读全文🌟 嘿!RL 圈的潮玩咖看过来!大模型时代卷起技术狂潮,强化学习(RL)早已不是 “小众玩家”,当它牵手大模型智能体,直接开启「王炸组合」模式!想不想潜入神秘据点,边嗨边聊最 in 的 RL 新范式?
阅读全文机器之心发布机器之心编辑部大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向,MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升,平均准确性提升超过 38.97%
阅读全文机器之心报道机器之心编辑部是否可以在不依赖额外监督的前提下,仅通过无监督学习让模型学会思考? 答案有了。在心理学领域,人类思维通常被划分为两种不同类型:系统 1(快速思维)和系统 2(慢速思维)。当面
阅读全文GPT-4o式的多模态大模型(LMMs)展现出在文本、视觉和语音模态上的全能能力,其在线语音服务还能在语音交互过程中同步提供中间文本结果(即用户输入和模型响应的转录内容),为用户提供“边看边听”的灵活
阅读全文机器之心报道编辑:张倩用AI给自己看病正在成为新趋势,但目前我们仍需要人类医生。身体不适,求医十年,医生没找出原因,ChatGPT 给分析出来了。这是一位 Reddit 网友刚刚分享的个人经历。这位网
阅读全文机器之心报道编辑:Panda2017 年,一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭,其中提出的 Transformer 依然是现今主流语言模型的基
阅读全文来自加利福尼亚大学圣迭戈分校(UC San Diego)Biwei Huang 实验室的研究团队提出了一种自主因果分析智能体 Causal-Copilot。该实验室专注于因果推理与机器学习的交叉研究,
阅读全文机器之心报道编辑:杨文、泽南马斯克搭帐篷熬夜开发有效果了?这么高跑分,还不发布。刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称,Grok
阅读全文本论文共同第一作者闫泽轩和马跃分别是上海交通大学人工智能学院2025级研究生,以及香港科技大学2024级博士生。目前在上海交通大学EPIC Lab进行科研实习,接受张林峰助理教授指导,研究方向是高效模
阅读全文本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。OpenAI 将 “组织级智能 (Organizational AI)”
阅读全文机器之心报道编辑:杜伟、泽南大语言模型(LLM)以生成能力强而著称,但如何能让它「听话」,是一门很深的学问。基于人类反馈的强化学习(RLHF)就是用来解决这个问题的,其中的奖励模型 (Reward M
阅读全文机器之心报道编辑:杨文这个AI让打工人「磕头」致谢。前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩
阅读全文近年来,基于智能体的强化学习(Agent + RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据
阅读全文机器之心报道机器之心编辑部不知大家是否还记得 Roy Lee 这位网红小哥,他曾先后被哈佛大学和哥伦比亚大学开除,之后辍学创办公司,并成功获得 530 万美元的投资。如今,他的初创公司 Cluely
阅读全文机器之心报道编辑:Panda据路透社等多家媒体报道,一位知情人士称,OpenAI 最近开始租用谷歌的 AI 芯片来支持 ChatGPT 及其其他产品。现目前,OpenAI 是英伟达 GPU 的最大买家
阅读全文本文第一作者为美国东北大学博士生沈轩,研究方向为高效人工智能,致力于在 GPU、移动端、FPGA 和 ASIC 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏,研究方向聚焦
阅读全文机器之心报道编辑:泽南AI 生成的「最后一道关卡」已经突破?因为生成式 AI,火遍全球的 Labubu 有了超萌专属 BGM:视频来自可灵 AI 创意圈用户。复杂的自然环境也可以获得相应的背景音。视频
阅读全文机器之心报道机器之心编辑部只需一眨眼的功夫,Mercury 就把任务完成了。「我们非常高兴地推出 Mercury,这是首款专为聊天应用量身定制的商业级扩散 LLM!Mercury 速度超快,效率超高,
阅读全文本文第一作者为北京邮电大学副教授、彩云科技首席科学家肖达,其他作者为彩云科技算法研究员孟庆业、李省平,彩云科技CEO袁行远。残差连接(residual connections)自何恺明在 2015 年
阅读全文机器之心报道编辑:杨文马斯克终于不「画饼」了!4.2美元坐特斯拉Robotaxi初体验:平稳但尚不成熟。马斯克兑现了承诺。早在十年前,埃隆・马斯克就曾多次表示,特斯拉有能力推出无人驾驶服务,但后来却食
阅读全文机器之心报道编辑:Panda斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型(Language Models from Scratch)」相关课程和材料现已在网上全面发布! 课程
阅读全文在 3D 重建领域,无论是 NeRF 还是最新的 3D Gaussian Splatting(3DGS),在生成逼真新视角时仍面临一个核心难题:视角一旦偏离训练相机位置,图像就容易出现模糊、鬼影、几何
阅读全文机器之心报道机器之心编辑部人人都绕不开的推荐系统,如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前
阅读全文机器之心报道编辑:张倩生成模型会重现识别模型的历史吗?今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友,很多参会者还参加了个非常有意思的项目 —— 追星。这个「星」自然是学
阅读全文近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。如今,这股
阅读全文机器之心原创作者:张倩「2025 年,多模态生成是一个好方向吗?」这是一位同学在今年年初提出的问题。他之所以有此疑问,是因为在找实习时发现,狭义的 AIGC(如视频生成)岗位较少,就业前景不佳,自己的
阅读全文