PaperWeekly

清华新作颠覆CoT！ParaThinker并行思考，终结单链推理天花板
作者：PaperWeekly发布日期：2025-09-17 23:19:25
近年来，大语言模型（LLMs）在复杂推理任务上的能力突飞猛进，这在很大程度上得益于深度思考的策略，即通过增加测试时（test-time）的计算量，让模型生成更长的思维链（Chain-of-Though
阅读全文
一招打破瓶颈！HyperTree超树规划：AI掌握层级化推理，复杂任务全面突破
作者：PaperWeekly发布日期：2025-09-16 23:55:51
©PaperWeekly 原创· 作者 | 桂润泉学校 | 中国科学技术大学硕士生研究方向 | 大语言模型复杂推理、复杂规划在大语言模型（LLMs）飞速发展的今天，它们在数学计算、逻辑推理等领域已展现
阅读全文
EMNLP 2025 | 跨风格不误判！MoSEs用职业写作风格建模，检测AI文本更稳更准
作者：PaperWeekly发布日期：2025-09-16 23:55:51
随着大语言模型（LLMs）在新闻创作、学术研究、评论生成等领域的广泛应用，其潜在滥用风险引发了公众对内容真实性的担忧，如 AI 生成假新闻误导舆论、AI 代写学术内容引发学术不端等问题。在此背景下，构
阅读全文
北京内推 | 微软Copilot算法团队招聘大模型推理方向研究型实习生
作者：PaperWeekly发布日期：2025-09-16 23:55:51
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软M365 Copilot 团队是微软在智能办公领域的核心研发力量，致力于打
阅读全文
从Muon到AdaMuon：下一代优化器能否真正取代Adam？
作者：PaperWeekly发布日期：2025-09-15 23:36:37
©作者 | Chong Jie单位 | 上海交通大学研究方向 | 参数高效微调放在开头：这篇文章会比较零碎，是由我之前做过的一次分享记录而成。我没有特意去梳理文章，直接把讲稿拿来主义，属于知识比较密集
阅读全文
EMNLP 2025 | LLM也会“装成人”？对比重写CoPA挑战AI文本检测可信度
作者：PaperWeekly发布日期：2025-09-15 23:36:37
大语言模型（LLM）的滥用（如学术抄袭、虚假信息生成）推动了 LLM 文本检测器的发展，用于判别由模型生成的文本。为规避这些检测器，研究人员提出了重写攻击，即有意重写文本以逃避检测。尽管已有一定成效，
阅读全文
博士申请 | 南京大学范琦老师课题组招收26级/27级视频生成/世界模型方向博士生
作者：PaperWeekly发布日期：2025-09-15 23:36:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！南京大学南京大学智能科学与技术学院是南京大学在苏州校区首批建设的学院之一。在人
阅读全文
北京/杭州/西雅图内推 | 阿里通义实验室LLM Research团队招聘大模型研究科学家
作者：PaperWeekly发布日期：2025-09-15 23:36:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队
阅读全文
Adam的Update RMS为何总是0.2？噪声模拟到理论近似全讲透
作者：PaperWeekly发布日期：2025-09-12 20:37:02
©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知，我们很早就开始尝试将 Muon 用于大规模 LLM 的训练。特别地，在QK-Clip巧解M
阅读全文
KDD 2025最佳论文亚军：参数不同还能共训？异构知识迁移框架HtFLlib全面开源
作者：PaperWeekly发布日期：2025-09-12 20:37:02
©PaperWeekly 原创· 作者 | 张剑清单位 | 上海交通大学我们在 GitHub 上开源了一个异构模型间知识迁移框架 HtFLlib，中稿 KDD 并获评 Best Paper Runne
阅读全文
「做笔记」的RAG来了！告别噪声与骨牌效应，EviNote-RAG稳住长链推理
作者：PaperWeekly发布日期：2025-09-12 20:37:02
在检索增强生成（RAG）飞速发展的当下，研究者们面临的最大困境并非「生成」，而是「稳定」。低信噪比让关键信息淹没在冗余文档里，错误累计则让推理链像骨牌一样层层坍塌。这两大顽疾，使得现有 RAG 系统
阅读全文
北京/上海内推 | 小红书智能审核算法团队招聘NLP/多模态内容理解算法工程师/实习生
作者：PaperWeekly发布日期：2025-09-12 20:37:02
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！小红书小红书智能审核算法团队，致力于通过多模态、大模型、Agent等算法能力，
阅读全文
别再狂刷CoT了！港科广DIGAI Lab发布隐式推理全景综述，静默思考开启新范式
作者：PaperWeekly发布日期：2025-09-11 23:44:57
大语言模型（LLMs）的“聪明与否”，很大程度上表现在它们能否真正完成复杂推理。过去，研究者常依赖显式链式推理（Chain-of-Thought，CoT），让模型逐步写出思考过程，虽然可解释，但输出冗
阅读全文
博士申请 | 新加坡国立大学计算机系卞亚涛老师招收2026 Fall人工智能全奖博士/博后
作者：PaperWeekly发布日期：2025-09-11 23:44:57
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！新加坡国立大学新加坡国立大学（National University of S
阅读全文
DeepSeek、Gemini都不行？AgenTracer锁定多智能体“背锅侠”，8B小模型反超闭源巨模
作者：PaperWeekly发布日期：2025-09-10 13:40:28
在大模型的持续进化过程中，我们见证了单体模型（monolithic LLM/agents）逐渐让位于更复杂、更灵活的多智能体（multi-agent）系统。后者往往通过多个大模型协同运作，再配合工具调
阅读全文
院士领衔！从智能算网到司法AI：顶尖学者直播解读AI与工程前沿趋势
作者：PaperWeekly发布日期：2025-09-10 13:40:28
人工智能正在深刻改变人类社会，同时带来技术与伦理的新挑战。为推动跨学科交流与高水平研究，英国工程技术学会（IET）与上海交通大学联合推出AI新刊 Artificial Intelligence for
阅读全文
SFT真不如RL？MIT团队抛出“RL的剃刀”，砍掉遗忘直通终身学习
作者：PaperWeekly发布日期：2025-09-10 13:40:28
©来源 | 机器之心我们已经进入了大模型时代，越来越多的应用依赖大模型的能力，可以说大模型已经成为智能化基础设施的核心组成部分，支撑着语言，视觉分析，智能驾驶，机器人等各种下游应用。在大模型的实际使用
阅读全文
北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生（可远程）
作者：PaperWeekly发布日期：2025-09-10 13:40:28
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！AMDAMD 是高性能与自适应计算领域的领先企业，致力于提供优质的产品和服务，
阅读全文
报名启动！西湖大学云谷青年学者论坛·人工智能分论坛诚邀全球英才
作者：PaperWeekly发布日期：2025-09-09 13:40:57
云谷青年学者论坛云谷青年学者论坛是西湖大学工学院打造的品牌引才活动。第六届云谷青年学者论坛将以线上方式举办，秉承往届云谷青年学者论坛的办会宗旨，为海内外优秀青年学者搭建起合作与交流的平台。01人工智能
阅读全文
不止综述！多模态大模型持续学习全链路：Benchmark、方法与Codebase一网打尽
作者：PaperWeekly发布日期：2025-09-09 13:40:57
近年来，生成式 AI 和多模态大模型（MLLMs）在各领域取得了令人瞩目的进展。然而，在现实世界应用中，动态环境下的数据分布和任务需求不断变化，大模型如何在此背景下实现持续学习（Continual L
阅读全文
ICML 2025 | 别再只拼CoT了！不完备信息下的主动推理，LLM普遍掉线
作者：PaperWeekly发布日期：2025-09-09 13:40:57
大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题
阅读全文
科研实习 | 北京大学计算机学院潘亮铭老师课题组招收NLP/大模型方向科研实习生
作者：PaperWeekly发布日期：2025-09-09 13:40:57
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！北京大学北京大学计算机学院潘亮铭老师课题组招收自然语言处理/大模型方向科研实习
阅读全文
导师放养真的会毁掉一个人……
作者：PaperWeekly发布日期：2025-09-08 13:31:37
最近经常收到读者的留言 : 抱怨科研真是太难了，竞争压力大，导师不给指导、不开组会，一年见不到导师几次，对于论文初稿、毕业论文毫无建议!无论什么专业的研究生，面对这样的灵魂拷问，很有可能都要陷入沉思。
阅读全文
Focal Loss也能无监督？北大×港中文团队用“双重不确定性优化”提升鲁棒3D感知
作者：PaperWeekly发布日期：2025-09-08 13:31:37
还认为 Focal Loss 只能在有监督场景使用？还在为 3D 检测模型在分布外泛化的不稳定性焦虑？来自北京大学，香港中文大学和鹏城实验室的最新研究提出了 DUO 框架（Dual Uncertain
阅读全文
给RL装上“防抖器”！GRPO稳化版来了：更高熵、更低KL、更稳更新
作者：PaperWeekly发布日期：2025-09-08 13:31:37
近年来，强化学习（RL）在大型语言模型（LLM）的微调过程中，尤其是在推理能力提升方面，取得了显著的成效。传统的强化学习方法，如近端策略优化（Proximal Policy Optimization，
阅读全文
深圳内推 | 腾讯音乐天琴实验室招聘音乐生成算法研究员（社招/校招）
作者：PaperWeekly发布日期：2025-09-08 13:31:37
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！腾讯音乐腾讯音乐天琴实验室致力于对音视频相关AI方向研究，持续推出创新技术，提
阅读全文
透明度罕见！百川公开M2完整技术报告，强化学习新范式引发行业关注
作者：PaperWeekly发布日期：2025-09-05 13:05:22
近日，百川公开 1 万 6000 字的 M2 完整技术报告，几乎每一个训练过程、创新方法，以及背后的思考都毫不保留的详细阐述，这让关注大模型、后训练最前沿技术探索的从业者获得感满满。接下来，本文将带
阅读全文
KDD 2025 | 图异常基础模型来了：跨域零样本、少样本微调，原型残差全拿下
作者：PaperWeekly发布日期：2025-09-05 13:05:22
介绍图异常检测（Graph Anomaly Detection，GAD）旨在识别与图中大多数节点不同的异常节点，近年来已受到广泛关注。现有的一般化图模型虽然在多种图任务中取得了显著成功，但在推广到 G
阅读全文
推理加持的排序SOTA！把“召回+相似度”写进RL，文档排序更稳更准
作者：PaperWeekly发布日期：2025-09-05 13:05:22
推理大模型（Large Reasoning Model）极大的促进了自然语言处理领域的发展，而信息检索领域的核心问题之一是文档排序，如何利用强大的推理大模型通过主动推理来判断文档的相关性，进而再对文档
阅读全文
博士申请 | 香港中文大学（深圳）游宇宁老师招收人工智能+生物医药全奖博士/实习生
作者：PaperWeekly发布日期：2025-09-05 13:05:22
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港中文大学（深圳）香港中文大学（深圳）是一所经教育部批准，参照中外合作办学条
阅读全文