上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈
一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗
阅读全文一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗
阅读全文机器之心报道编辑:佳琪、蛋酱半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择
阅读全文机器之心报道机器之心编辑部一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等
阅读全文随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑
阅读全文研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研
阅读全文机器之心报道编辑:杨文、泽南从来没见过人类做出这样的决策……太优美了。又有谷歌大模型核心成员出来创业了。3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Re
阅读全文机器之心报道机器之心编辑部思维链引发的战争。众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。但随着近期 AI 技术的突破、双方的分歧
阅读全文该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool
阅读全文本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人
阅读全文机器之心报道机器之心编辑部在这篇文章中,我们记录了 Manus 的实际使用感受,并介绍了 Manus 的开源复刻版本。昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件
阅读全文机器之心报道编辑:杜伟法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。一出手就是号称「世界上最好的 OCR 模型」!新产品 Mistral OCR 是一种光学字符识别 AP
阅读全文机器之心报道编辑:泽南他回来了。谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。据外媒 The Information 本周四报道,拉里・佩奇成立了名
阅读全文随着生成式人工智能技术(AIGC)的突破,文本到图像模型在故事可视化领域展现出巨大潜力,但在多角色场景中仍面临角色一致性差、布局控制难、动态叙事不足等挑战。为此,北京大学、上海人工智能实验室、南洋理工
阅读全文复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouS
阅读全文机器之心报道编辑:Panda事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,
阅读全文论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接:https://www.researchga
阅读全文机器之心发布 机器之心编辑部2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:
阅读全文机器之心报道编辑:泽南、杜伟价格低了点,功耗高了点,性能和原来差不多?昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。我们知道,最近英伟达 RTX 50 系显
阅读全文机器之心发布机器之心编辑部真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。为了解决这一问题,近日字节跳动 ByteDanc
阅读全文AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
阅读全文机器之心报道 编辑:张倩、佳琪在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性?这是一项新研究得出的结论。这项研究来自 Copyleaks——
阅读全文选自Quanta Magazine作者:Leila Sloman编译:杜伟、陈陈故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay conje
阅读全文AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
阅读全文在人工智能领域,如何引导大语言模型产出贴合人类偏好的内容,已成为备受瞩目的研究焦点。强化学习从人类反馈中学习(RLHF)作为该领域的重要方法之一,虽成效显著,但也暴露出多阶段优化流程复杂、计算负担沉重
阅读全文机器之心报道 作者:泽南、杜伟或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。在移动端,革新正
阅读全文机器之心报道编辑:杜伟近段时间,DeepSeek R1 推理模型引爆了国内外社交媒体,让人们见识到了大语言模型类人的深度思考能力。虽然 DeepSeek R1、OpenAI o1 和 o3 等推理模型
阅读全文AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
阅读全文选自GitHub作者:Andriy Burkov机器之心编译GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多
阅读全文机器之心报道编辑:大盘鸡、杜伟AI智能体有自己的交流方式。最近有这么一段视频被千万网友围观。两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超
阅读全文AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
阅读全文