PaperWeekly

ICML 2025 | 模型不开口也能配合？贝叶斯纳什均衡重塑多智能体LLM协作
作者：PaperWeekly发布日期：2025-08-14 23:52:53
当前，通过 prompt 引导多个大语言模型（LLM）进行协作，如多智能体辩论（Multi-agent Debate），已被证明能显著增强模型的复杂推理能力。然而，基于“显式多轮信息交互“的多模型框架
阅读全文
别再二选一了！一文看懂On-Policy与Off-Policy的本质分歧（含GRPO深度拆解）
作者：PaperWeekly发布日期：2025-08-14 23:52:53
©作者 | 吴宇斌单位 | 摩尔线程研究方向 | GUI agent在强化学习（Reinforcement Learning，RL）中，on-policy 和 off-policy 是两种核心的学习策
阅读全文
告别Transformer？上海交大「原生类脑」BriLLM首秀：信号流重塑大模型范式
作者：PaperWeekly发布日期：2025-08-14 23:52:53
当前 GPT 类大语言模型的表征和处理机制，仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下，人类大脑直接在分布式的皮层区域中编码语义，如果将其视为一个语言处理系统，它本身就是一个在全局
阅读全文
博士申请 | 新加坡国立大学计算机系刘安吉老师招收生成模型/LLM方向全奖博士/博后/实习生
作者：PaperWeekly发布日期：2025-08-14 23:52:53
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！新加坡国立大学新加坡国立大学（National University of S
阅读全文
Kimi K2背后的冷门绝招：海量语料“重写”如何榨干每个token？
作者：PaperWeekly发布日期：2025-08-13 23:35:31
©作者 | 李嘉诚研究方向 | 大模型预训练和对齐前段时间 K2 作为国际一线模型发布，优秀的效果、开源权重和新技术验证赢得海内外一片掌声，其技术报告中罕见地提到了部分数据构成的细节，例如对于信息密度
阅读全文
ICML 2025 | 奖励模型还用人标？APEC用对抗模仿生成偏好，泛化能力直线上升
作者：PaperWeekly发布日期：2025-08-13 23:35:31
©作者 | 张智龙单位 | 南京大学研究方向 | 强化学习和世界模型非常高兴我们的工作《Improving Reward Model Generalization from Adversarial P
阅读全文
Attention Sink的起源找到了？清华×美团首次锁定MoE中的「超级专家」
作者：PaperWeekly发布日期：2025-08-13 23:35:31
稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。
阅读全文
博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生
作者：PaperWeekly发布日期：2025-08-13 23:35:31
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！休斯敦大学休斯敦大学的计算机系非常具有学术竞争力。于2024年，CSRanki
阅读全文
后训练轻量「小枝」强势出击！极限剪裁视觉token，推理加速154%
作者：PaperWeekly发布日期：2025-08-12 12:33:43
近年来，GPT-4V 等视觉语言大模型（large vision-language model，LVLM）表现出卓越的多模态理解能力和通用性，尤其是在文档分析、GUI 自动化、机械臂控制等领域展现出令
阅读全文
实验室抢显卡抢破头？A800/H800骨折价来袭，超值返券助你轻松冲DDL！
作者：PaperWeekly发布日期：2025-08-12 12:33:43
过去几年，做模型训练、推理、微调的人都有同一个痛点：显卡要么排不到，要么价格被炒到天上。而今年，显卡资源紧张问题愈发严峻——SFT、RLHF、MoE 以及多模态训练纷纷上阵，显存需求骤增，钱包压力也随
阅读全文
ICCV 2025 | Scaffold反噬联邦学习？NTU联手0G Labs揭示中心化训练安全漏洞
作者：PaperWeekly发布日期：2025-08-12 12:33:43
通过使用控制变元（control variate）来校准每个客户端的本地梯度，Scaffold 已被广泛认为是缓解联邦学习中数据异质性影响的一种强大方案。但尽管 Scaffold 实现了显著的性能提升
阅读全文
北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生
作者：PaperWeekly发布日期：2025-08-12 12:33:43
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！度小满金融DXM ITDD 视觉和多模态团队：我们专注于图像、视频、文本信息的
阅读全文
建议所有博士都去学一遍，这次真的赢麻了！
作者：PaperWeekly发布日期：2025-08-11 12:32:13
无论你是博士，还是硕士，肯定都因为发不出sci而自我怀疑过！是自己天资不够？不适合科研？还是努力还不够？其实都不是！无论是选题没有头绪，实验漏洞百出，还是论文改来改去依旧被拒。这都是因为你没有遇到一个
阅读全文
ICCV 2025 | 终结灾难性遗忘！南大提出外部知识注入机制，刷新CLIP持续学习SOTA
作者：PaperWeekly发布日期：2025-08-11 12:32:13
持续学习旨在使学习系统不断学习流式数据中的知识。随着预训练技术的发展，预训练视觉-语言模型（如 CLIP）通过引入预训练知识促进了持续学习的发展。然而，CLIP 通过将视觉表征与类别名称匹配来进行判别
阅读全文
超越样本级RL！人大×快手提出ARPO：熵驱动Agent探索，多轮推理性能飙升
作者：PaperWeekly发布日期：2025-08-11 12:32:13
在可验证强化学习（RLVR）的推动下，大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中，LLM 往往需要结合外部工具进行多轮交互，现有 RL 算法在平衡模型的长程推理与多轮工具交互能力
阅读全文
北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生
作者：PaperWeekly发布日期：2025-08-11 12:32:13
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！盛大集团盛大是一家全球性的私人投资控股集团，由中国网络互动娱乐先锋陈天桥及其家
阅读全文
向量检索造数据全链路揭秘：Qwen3打样，Gemini精炼，Seed1.5推理升级
作者：PaperWeekly发布日期：2025-08-10 22:02:04
©作者 | 李嘉诚单位 | 字节跳动研究方向 | Retrieva & LLM近期，Google，字节跳动，阿里相继发布了他们最新的检索模型——gemini-embedding，seed1.5-emb
阅读全文
Dijkstra非最优解！清华团队突破最短路径排序瓶颈，STOC 2025最佳论文详解
作者：PaperWeekly发布日期：2025-08-10 22:02:04
©作者 | 机器之心每次打开导航的，导航软件在一秒内给出一个最速路线的时候，你有没有好奇过它是怎么找到这条路的？假如不考虑堵车、红绿灯等交通影响因素，仅找到一条最短最快的路线，那不论如何也逃不掉 Di
阅读全文
博士申请 | 香港大学陈城老师招收医疗AI方向全奖博士/研究助理/访问学生
作者：PaperWeekly发布日期：2025-08-10 22:02:04
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港大学香港大学创立于1911年，坐落于繁华的香港岛西部，是香港的首间大学，发
阅读全文
北京内推 | 京东物流技术与数据智能部招聘具身智能方向算法实习生
作者：PaperWeekly发布日期：2025-08-10 22:02:04
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！京东我们是京东物流-X科技部-具身智能研发团队，目前正在搭建团队，对于想从事具
阅读全文
「极简三角法」TriangleMix上线：LLM Prefill加速拉满，性能几乎无损！
作者：PaperWeekly发布日期：2025-08-08 23:14:27
©作者 | 何之源单位 | 微软亚洲研究院研究方向 | LLM efficiency我们近期提出了一项新工作 TriangleMix：一种可以在几乎不损失性能的前提下，大幅加速 LLM Prefill
阅读全文
函数能跑但写法离谱？北航IFEvalCode出手，专治多语言代码生成“不讲武德”
作者：PaperWeekly发布日期：2025-08-08 23:14:27
近日北航和 MAP 联合提出并开源了一个面向大模型（LLM）能力的新评测基准——IFEvalCode，聚焦于“可控代码生成”任务，支持多语言、跨编程语种、多维能力测评，并进一步提出了提升大模型可控性的
阅读全文
ICML 2025 | 千倍泛化不涨显存！蚂蚁推出新注意力机制，实现16M上下文精准检索
作者：PaperWeekly发布日期：2025-08-08 23:14:27
©作者 | 胡翔、武威单位 | 蚂蚁技术研究院在大语言模型如火如荼的当下，长文本建模仍然是一个极具挑战的问题。纠其根源，一方面在于主流 LLMs 的架构 Transformers 中平方复杂度及随序列
阅读全文
北京内推 | 微软MAI广告部门招聘分布式训练框架研发实习生
作者：PaperWeekly发布日期：2025-08-08 23:14:27
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软Microsoft AI是微软公司于2016年成立的专注于人工智能研究与开
阅读全文
生成不用“扩散”了？MeanFlow换轨平均速度，一步生成刷新加速上限
作者：PaperWeekly发布日期：2025-08-07 23:21:52
©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知，生成速度慢是扩散模型一直以来的痛点，而为了解决这个问题，大家可谓“八仙过海，各显神通”，提
阅读全文
中英双语一起破防！北大×腾讯发布“地狱级”测试基准，直击语音对话模型软肋
作者：PaperWeekly发布日期：2025-08-07 23:21:52
为什么你的语音助手总翻车？当用户说“苹果/不大好吃”和“苹果不大/好吃”，这个苹果到底大不大、好不好吃？当用户说“夏天能穿多少穿多少”和“冬天能穿多少穿多少”，指的到底是少穿一些还是多穿一些？这些人类
阅读全文
ICML 2025 | 撬开上下文理解黑盒：注意力机制中的极大值浮出水面
作者：PaperWeekly发布日期：2025-08-07 23:21:52
大型语言模型（LLMs）在上下文知识理解方面取得了令人瞩目的成功。近日，一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are
阅读全文
北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生
作者：PaperWeekly发布日期：2025-08-07 23:21:52
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴阿里夸克大模型团队在智能科技浪潮中迅速崛起，我们拥有处于上升阶段的核心
阅读全文
Attention Sink现象揭秘：Transformer为何偏爱首Token？
作者：PaperWeekly发布日期：2025-08-06 19:10:26
作者 | 郑明悟研究方向 | 大语言模型来源 | https://zhuanlan.zhihu.com/p/1932066570714215838Attention Sink 来源于 Transfor
阅读全文
ICCV 2025｜视角差、遮挡多？无人机视频融合BEV，定位稳了！
作者：PaperWeekly发布日期：2025-08-06 19:10:26
在现代无人机视觉精细地理定位任务（Drone-based Visual Geo-localization）中，传统基于图像的方法范式依赖于从无人机拍摄的单张图片进行匹配，但这种方式存在两个显著问题：视
阅读全文