全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AI离“可靠记忆”还有多远?HaluMem首次把记忆系统幻觉拆到操作级

    作者:PaperWeekly发布日期:2025-11-21 13:32:54

    AI 的“记忆系统”正在快速演化,但幻觉(Hallucination)问题依旧普遍存在。要让 AI 真正拥有“可靠记忆”,我们首先要弄清楚幻觉从哪里来、如何传播。▲ 图1 HaluMem与现有记忆系统

    阅读全文
  • 文章封面

    北京内推 | 小红书审核基础算法团队招聘增量预训练/RL/推理方向算法实习生

    作者:PaperWeekly发布日期:2025-11-21 13:32:54

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!小红书小红书审核基础算法团队,致力于研究并落地多模态、大模型、Agent、Re

    阅读全文
  • 文章封面

    SOTA集体掉线?美团AMO-Bench揭露大模型数学推理的真实段位

    作者:PaperWeekly发布日期:2025-11-20 13:14:14

    过去两年,AIME 等数学基准几乎被主流大模型打到了 90% 以上。可当同一批模型面对 AMO-Bench 时,最高得分也只有 56.0%。这组反差让一个被忽略已久的疑问重新浮上台面:我们以为已经“很

    阅读全文
  • 文章封面

    百万步0失误!LLM首次跑通1,048,575步长任务,不崩、不偏、不掉链

    作者:PaperWeekly发布日期:2025-11-20 13:14:14

    过去的大模型,再强也扛不住长链路:几十步稳、几百步飘、几万步基本要翻车。而这次,一个系统把 1,048,575 步跑到最后、零失误。这是在重写 LLM 的能力边界。在大模型的世界里,“一步错,全盘崩”

    阅读全文
  • 文章封面

    清华团队“密度法则”登上Nature子刊,揭示大模型高效化发展新规律

    作者:PaperWeekly发布日期:2025-11-19 18:35:33

    2020年以来,OpenAI提出的 Scaling Law 引领着大模型的快速发展 —— 模型参数和训练数据规模越大,产生的智能能力越强。然而进入 2025 年,训练开销不断扩增这一路径面临严峻的可持

    阅读全文
  • 文章封面

    点击下载!中国科研人员AI使用率全面领跑:Wiley发布全新调研报告

    作者:PaperWeekly发布日期:2025-11-19 18:35:33

    今年2月,威立发布了基于对近5000名科研人员进行调研的研究报告ExplanAItions。时隔半年,依托新一轮调研中由全球2430位科研人员反馈的最新数据,威立重磅推出ExplanAItions 2

    阅读全文
  • 文章封面

    JSON刚死24小时,TOON又被网友玩坏:LLM数据格式彻底乱套了

    作者:PaperWeekly发布日期:2025-11-18 14:09:21

    本来只是一条技术帖:“RIP JSON”。结果短短 48 小时内,TOON、VSC、GOON、BONER 五花八门的格式像烟花一样在工程师圈子里连续炸开。人人都在造新格式,人人都在玩梗,人人都在做对比

    阅读全文
  • 文章封面

    美团多篇论文入选NeurIPS 2025:从大模型到多模态的全线突破 | 直播预告

    作者:PaperWeekly发布日期:2025-11-18 14:09:21

    本文精选了美团技术团队在国际顶会NeurIPS 2025中发表的10篇论文,研究方向覆盖了大模型、多模态、自然语音处理、计算机视觉、基础技术、因果推断等技术领域,希望相关研究能给同学们带来一些帮助或启

    阅读全文
  • 文章封面

    让千问APP当一周科研打工人:它比我想的能干,也比我想的累

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    我把自己一周的博士日常全塞进了千问 APP——读论文、啃图表、跑实验、写 related work、救火 debug……结果用着用着,我突然有点怀疑:这手机里的模型,可能比我更像个 PhD。这两年,大

    阅读全文
  • 文章封面

    双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    引言视觉-语言导航(Vision-and-Language Navigation, VLN)作为具身智能的关键研究领域,旨在赋予智能体遵循自然语言指令在未知三维环境中导航的能力。近年来,多模态大语言模

    阅读全文
  • 文章封面

    ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?

    作者:PaperWeekly发布日期:2025-11-16 12:26:30

    最近 ICLR 出了一个让学术圈纷纷停下来围观的瓜:一篇明显由大模型生成的投稿论文,不但顺利进入了评审流程,还拿到了两个 8 分——给分给得挺爽,但从评语里看不太出来 reviewer 到底理解了多少

    阅读全文
  • 文章封面

    无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段

    作者:PaperWeekly发布日期:2025-11-16 12:26:30

    当今,LLM 已经在语言理解、推理和生成上取得了突破性进展,但面临长文本输入时性能往往急剧下降:模型“记不住”、推理链断裂、关键信息遗漏。这正是目前最棘手的长上下文理解问题。近年来,研究者们提出了多个

    阅读全文
  • 文章封面

    OpenAI把Transformer训练成「几乎全零」,黑箱首次被彻底揭开

    作者:PaperWeekly发布日期:2025-11-14 11:47:06

    OpenAI 做了一件几乎没人敢尝试的事:把 Transformer 的权重在训练中直接压到近乎全零,强迫它用极少的连接完成所有计算。在这种极端约束下,模型内部真正承担推理的“计算电路”第一次以可分离

    阅读全文
  • 文章封面

    ACL 2025 | 用图结构让RAG学会「记忆与总结」,重塑长上下文理解

    作者:PaperWeekly发布日期:2025-11-14 11:47:06

    当我们希望 LLM 总结一份上万字的会议记录、论文或新闻合集时,即便是拥有超长上下文窗口的模型也常常记不住重点:重要信息淹没在冗长文本中,导致生成结果模糊、片段化。为了解决这一问题,Retrieval

    阅读全文
  • 文章封面

    杭州/北京内推 | 阿里淘天算法团队招聘多模态理解方向算法实习生

    作者:PaperWeekly发布日期:2025-11-14 11:47:06

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴淘天集团是阿里巴巴旗下的业务集团,全球领先的互联网消费平台企业,主要由

    阅读全文
  • 文章封面

    建议所有博士都去学一遍,赢麻了

    作者:PaperWeekly发布日期:2025-11-13 12:35:38

    新手搞科研,发不出顶会顶刊,不是因为你不够努力,而是因为你仍在沿用那套低效、耗时的传统科研模式!传统模式要求你“从0到1”搞出一个极具创新的idea,然后花大量时间去验证、实现。这种模式对于科研新手来

    阅读全文
  • 文章封面

    深度研究智能体真的“懂你”吗?OPPO × 浙大首发个性化深度研究评测基准

    作者:PaperWeekly发布日期:2025-11-13 12:35:38

    大模型智能体正从“通用问答”迈向“深度研究”——不仅能自主检索、整合信息,还能生成结构清晰、证据充分的深度研究报告。然而,现有评测体系仍聚焦于“事实是否准确”“内容是否完整”,却忽视了一个关键问题:这

    阅读全文
  • 文章封面

    博士申请 | 佛罗里达大学计算机系招收NLP/LLM方向全奖博士/实习生

    作者:PaperWeekly发布日期:2025-11-13 12:35:38

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!佛罗里达大学根据US News,佛罗里达大学在美国所有大学中的综合排名是30名

    阅读全文
  • 文章封面

    双十一算力真敢卷!RTX 5090低至0.69元/时,同预算跑更多实验

    作者:PaperWeekly发布日期:2025-11-12 18:11:14

    十一月了,大家的论文实验跑得怎么样?模型、数据、参数调了一轮又一轮,最怕的还是算力不够用——卡难抢、节点不稳、训练一断就得重跑。过去一年,GPU 租赁价格的下行速度几乎和模型迭代一样快。A800 的租

    阅读全文
  • 文章封面

    AAAI 2026 | 悉尼科技大学 × 港理工推出 FedVLR:让联邦推荐也能“懂图文”

    作者:PaperWeekly发布日期:2025-11-12 18:11:14

    在推荐系统中,同时利用图像和文本信息来理解物品早已不是新鲜事。但如果场景换成联邦学习,即所有用户数据都必须保留在本地设备上,我们该如何高效地融合这些多模态信息,并为每个用户提供个性化的服务呢?这是一个

    阅读全文
  • 文章封面

    北京内推 | 阿里高德地图团队招聘大模型方向算法实习生(可长期/转正)

    作者:PaperWeekly发布日期:2025-11-12 18:11:14

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队聚焦大模型与高德核心业务的深度融合。围绕用户出行、搜索、导航、PO

    阅读全文
  • 文章封面

    全模态到底是不是“1+1>2”?美团UNO-Bench揭示单模态与全模态能力的组合规律

    作者:PaperWeekly发布日期:2025-11-11 13:33:22

    全模态协同究竟是确实存在的能力交互,还是一种看上去更像自然叠加的错觉?UNO-Bench 的意义不在于新增一个榜单,而是第一次把这个争论多年的问题,转成了可以被量化检验的对象。过去两年,多模态模型的对

    阅读全文
  • 文章封面

    通往AGI的歧路:上海AI Lab重磅发现,自进化智能体可能“错误进化

    作者:PaperWeekly发布日期:2025-11-11 13:33:22

    我们正处在一个激动人心的时代:能够自我学习、自我迭代的“自进化智能体”(Self-evolving Agent)正从科幻走向现实。它们能自主总结经验、迭代工具、优化工作流,展现出通往通用人工智能(AG

    阅读全文
  • 文章封面

    北京内推 | 百度文心一言基座团队模型组招聘大模型方向研究型实习生

    作者:PaperWeekly发布日期:2025-11-11 13:33:22

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练

    阅读全文
  • 文章封面

    过去五年,BERT都在被“过度训练”?LeCun团队给出Encoder算力最优范式

    作者:PaperWeekly发布日期:2025-11-10 17:33:37

    这篇来自 Yann LeCun 团队(FAIR × NYU)的 EMNLP 2025 论文做了一件简单但惊人到颠覆经验的事:Encoder 的最佳训练规律,和我们过去五年默认采用的经验——根本不是一回

    阅读全文
  • 文章封面

    EMNLP 2025 | 别再只看KV了!LLM越深越稀疏:UNCOMP用矩阵熵给出答案

    作者:PaperWeekly发布日期:2025-11-10 17:33:37

    ©作者 | 熊璟单位 | 香港大学博士生研究方向 | 大语言模型推理我们都知道 LLM 中存在结构化稀疏性,但其底层机制一直缺乏统一的理论解释。为什么模型越深,稀疏性越明显?为什么会出现所谓的“检索头

    阅读全文
  • 文章封面

    北京内推 | 腾讯AI Lab招聘大模型/多模态大模型方向研究型实习生

    作者:PaperWeekly发布日期:2025-11-10 17:33:37

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯AI Lab我们正在探索下一代大型语言模型(LLM)与全模态模型的未来,致

    阅读全文
  • 文章封面

    上交大刘鹏飞团队:Context Engineering进入2.0,上下文成为可操作对象

    作者:PaperWeekly发布日期:2025-11-07 14:01:26

    我们早已习惯在提示词、记忆窗口、外部检索器之间调参,以期让模型理解更多上下文。可在上海交大刘鹏飞团队的最新论文中,上下文工程不再是工程师堆 token 的技巧,而是一个可被形式化的科学对象。他们称之为

    阅读全文
  • 文章封面

    工程&计算机领域前沿洞察 | Synthesis技术前沿报告合集

    作者:PaperWeekly发布日期:2025-11-07 14:01:26

    随着技术与计算机科学等领域的迅猛发展,新研究层出不穷,在快速出版与内容深度之间取得平衡,成为学术图书面临的新挑战。数字化出版加快了修订节奏,使新成果得以及时纳入,而“小型图书”则提供了另一种解决方案,

    阅读全文
  • 文章封面

    自回归不必按token算了:微信AI × 清华用CALM直接「整段」预测

    作者:PaperWeekly发布日期:2025-11-06 14:12:38

    我们默认了两件事很久:语言模型应该逐 token 生成;加速只能靠算力。CALM 的关键在于——它质疑的是这两件事本身。在当前主流语言模型里,时间成本的基本单位是下一 token。这是一个我们长期习以

    阅读全文
上一页下一页