全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

    作者:机器之心发布日期:2025-03-09 12:08:30

    一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗

    阅读全文
  • 文章封面

    Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道编辑:佳琪、蛋酱半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择

    阅读全文
  • 文章封面

    GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道机器之心编辑部一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等

    阅读全文
  • 文章封面

    长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

    作者:机器之心发布日期:2025-03-09 12:08:30

    随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑

    阅读全文
  • 文章封面

    7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

    作者:机器之心发布日期:2025-03-08 12:18:44

    研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研

    阅读全文
  • 文章封面

    目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道编辑:杨文、泽南从来没见过人类做出这样的决策……太优美了。又有谷歌大模型核心成员出来创业了。3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Re

    阅读全文
  • 文章封面

    微软甩开OpenAI自研大模型,还计划用DeepSeek

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道机器之心编辑部思维链引发的战争。众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。但随着近期 AI 技术的突破、双方的分歧

    阅读全文
  • 文章封面

    ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

    作者:机器之心发布日期:2025-03-08 12:18:44

    该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool

    阅读全文
  • 文章封面

    攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」

    作者:机器之心发布日期:2025-03-08 12:18:44

    本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人

    阅读全文
  • 文章封面

    不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道机器之心编辑部在这篇文章中,我们记录了 Manus 的实际使用感受,并介绍了 Manus 的开源复刻版本。昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件

    阅读全文
  • 文章封面

    千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道编辑:杜伟法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。一出手就是号称「世界上最好的 OCR 模型」!新产品 Mistral OCR 是一种光学字符识别 AP

    阅读全文
  • 文章封面

    谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道编辑:泽南他回来了。谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。据外媒 The Information 本周四报道,拉里・佩奇成立了名

    阅读全文
  • 文章封面

    CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

    作者:机器之心发布日期:2025-03-07 12:37:07

    随着生成式人工智能技术(AIGC)的突破,文本到图像模型在故事可视化领域展现出巨大潜力,但在多角色场景中仍面临角色一致性差、布局控制难、动态叙事不足等挑战。为此,北京大学、上海人工智能实验室、南洋理工

    阅读全文
  • 文章封面

    DeepSeek的MLA,任意大模型都能轻松迁移了

    作者:机器之心发布日期:2025-03-06 20:23:39

    复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouS

    阅读全文
  • 文章封面

    强化学习成帮凶,对抗攻击LLM有了新方法

    作者:机器之心发布日期:2025-03-06 20:23:39

    机器之心报道编辑:Panda事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,

    阅读全文
  • 文章封面

    从自我进化视角出发,全面解析LLM的推理能力技术演进路径

    作者:机器之心发布日期:2025-03-06 20:23:39

    论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接:https://www.researchga

    阅读全文
  • 文章封面

    当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

    作者:机器之心发布日期:2025-03-06 20:23:39

    机器之心发布 机器之心编辑部2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:

    阅读全文
  • 文章封面

    英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的

    作者:机器之心发布日期:2025-03-05 18:02:45

    机器之心报道编辑:泽南、杜伟价格低了点,功耗高了点,性能和原来差不多?昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。我们知道,最近英伟达 RTX 50 系显

    阅读全文
  • 文章封面

    大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC

    作者:机器之心发布日期:2025-03-05 18:02:45

    机器之心发布机器之心编辑部真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。为了解决这一问题,近日字节跳动 ByteDanc

    阅读全文
  • 文章封面

    大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达

    作者:机器之心发布日期:2025-03-05 18:02:45

    AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

    阅读全文
  • 文章封面

    DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

    作者:机器之心发布日期:2025-03-04 12:52:19

    机器之心报道 编辑:张倩、佳琪在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性?这是一项新研究得出的结论。这项研究来自 Copyleaks——

    阅读全文
  • 文章封面

    半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题

    作者:机器之心发布日期:2025-03-04 12:52:19

    选自Quanta Magazine作者:Leila Sloman编译:杜伟、陈陈故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay conje

    阅读全文
  • 文章封面

    北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

    作者:机器之心发布日期:2025-03-04 12:52:19

    AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

    阅读全文
  • 文章封面

    DPO-Shift:一个参数可控改变DPO分布,缓解似然偏移

    作者:机器之心发布日期:2025-03-04 12:52:19

    在人工智能领域,如何引导大语言模型产出贴合人类偏好的内容,已成为备受瞩目的研究焦点。强化学习从人类反馈中学习(RLHF)作为该领域的重要方法之一,虽成效显著,但也暴露出多阶段优化流程复杂、计算负担沉重

    阅读全文
  • 文章封面

    DeepSeek推出后,移动端AI风向要变

    作者:机器之心发布日期:2025-03-03 19:39:12

    机器之心报道 作者:泽南、杜伟或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。在移动端,革新正

    阅读全文
  • 文章封面

    多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

    作者:机器之心发布日期:2025-03-03 19:39:12

    机器之心报道编辑:杜伟近段时间,DeepSeek R1 推理模型引爆了国内外社交媒体,让人们见识到了大语言模型类人的深度思考能力。虽然 DeepSeek R1、OpenAI o1 和 o3 等推理模型

    阅读全文
  • 文章封面

    ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

    作者:机器之心发布日期:2025-03-03 19:39:12

    AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

    阅读全文
  • 文章封面

    DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

    作者:机器之心发布日期:2025-03-02 11:54:11

    选自GitHub作者:Andriy Burkov机器之心编译GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多

    阅读全文
  • 文章封面

    千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?

    作者:机器之心发布日期:2025-03-02 11:54:11

    机器之心报道编辑:大盘鸡、杜伟AI智能体有自己的交流方式。最近有这么一段视频被千万网友围观。两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超

    阅读全文
  • 文章封面

    ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了

    作者:机器之心发布日期:2025-03-02 11:54:11

    AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

    阅读全文
上一页下一页