PaperWeekly

建议所有博士都去学一遍，真的赢麻了
作者：PaperWeekly发布日期：2025-07-10 12:31:12
搞科研，最怕的就是每天“眼睛读文献，脑袋想方案”。以为只要文献读的够多，准备就足够充分，就能找到好选题，写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道：科研成果是干出来的
阅读全文
ICCV 2025 | 视觉Token跳起来！上交大×蚂蚁联手推出多模态通用加速框架
作者：PaperWeekly发布日期：2025-07-10 12:31:12
近日，上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队创新性地提出一种通用的视觉-语言模型加速框架 Skip-Vision。该框架不需要额外的预训练，也不需要重新训练大模型，只需在现有 S
阅读全文
大模型不再“自由发挥”？KAG-Thinker引入结构化思维，重塑大模型复杂推理范式
作者：PaperWeekly发布日期：2025-07-10 12:31:12
近日，蚂蚁集团知识引擎团队协同浙江大学、同济大学正式发布了其在结构化推理领域的最新成果 —— KAG-Thinker 模型，该模型是 KAG 框架的重要迭代升级，聚焦于为通用或专业领域复杂推理任务构
阅读全文
博士申请 | 香港科技大学（广州）钟秉灼老师招收具身智能安全全奖博士/博后/RA
作者：PaperWeekly发布日期：2025-07-10 12:31:12
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港科技大学（广州）香港科技大学（简称港科大）自1991年成立以来，凭借其锐意
阅读全文
人物设定一秒入魂！RAIDEN-R1提出可验证奖励新范式，让CoT推理更“人格一致”
作者：PaperWeekly发布日期：2025-07-08 23:20:34
背景近年来，随着大语言模型（LLM）的突破性进展，角色扮演对话代理（RPCAs）已成为人工智能领域的前沿研究方向。这类代理旨在模拟虚构角色或公众人物等特定人设，同时保持对预设角色特征的认知能力。工业界
阅读全文
ACL 2025 | 知道≠会说！UAlign用不确定性纠偏大模型幻觉，事实性对齐更进一步
作者：PaperWeekly发布日期：2025-07-08 23:20:34
本系列 blog 是有关大模型幻觉、知识、不确定性等方向的学习笔记分享，我会持续更新相关基础工作和最新研究，相关文献也整理在以下 GitHub 项目中，欢迎关注。https://github.com/
阅读全文
单个只有7B，组队打穿GPT-4.5！Avengers框架让小模型“组团作战”
作者：PaperWeekly发布日期：2025-07-08 23:20:34
本文由上海人工智能实验室，东北大学，西北工业大学联合完成。近年来，大语言模型（如 Gemini-2.5-Pro，GPT-4.1）逐渐被谷歌、OpenAI 等科技巨头垄断，训练成本数百万甚至数千万美元。
阅读全文
北京内推 | 微软亚洲互联网工程院搜索广告算法团队招聘广告算法实习生
作者：PaperWeekly发布日期：2025-07-08 23:20:34
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！微软亚洲互联网工程院微软搜索广告算法团队隶属微软亚洲互联网工程院，我们与来自全
阅读全文
直到毕业我才知道，原来读博延毕是常态
作者：PaperWeekly发布日期：2025-07-07 13:37:17
最近经常收到读者的留言 : 抱怨科研真是太难了，竞争压力大，导师不给指导、不开组会，一年见不到导师几次，对于论文初稿、毕业毫无建议! 其实他不是个例，大家也会有这样的烦恼：前沿顶会、期刊论文、综述文献
阅读全文
ICML 2025 | 会刷题≠懂数学！CogMath打造“认知显微镜”，深扒大模型的数学能力
作者：PaperWeekly发布日期：2025-07-07 13:37:17
随着大语言模型（LLMs）在各类推理应用上效果的持续提升，特别是数学基准测试（benchmark）上频繁刷榜，关于它们“是否真正理解数学”的讨论也日益增多。针对这一问题，中国科学技术大学认知智能全国重
阅读全文
模型顿悟真的存在？推理黑箱中的「Aha Moment」首次被精准捕捉
作者：PaperWeekly发布日期：2025-07-07 13:37:17
你肯定见过大模型在解题时「装模作样」地输出：「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。但一个灵魂拷问始终存在：这些词真的代表模型在「思
阅读全文
博士申请 | 香港城市大学赵翔宇老师招收机器学习/大模型方向全奖博士/博后
作者：PaperWeekly发布日期：2025-07-07 13:37:17
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港城市大学香港城市大学是一所坐落于香港九龙塘的公立研究型大学。2026年US
阅读全文
线性注意力简史：从模仿、创新到反哺
作者：PaperWeekly发布日期：2025-07-03 22:06:35
©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络在中文圈，笔者应该算是比较早关注线性 Attention 的了，在 2020 年写首篇相关文章线性A
阅读全文
一文搞定八大任务！北航×华为发布时空大模型BIGCity，打通轨迹与交通状态预测
作者：PaperWeekly发布日期：2025-07-03 22:06:35
北京航空航天大学联合华为 2012 实验室发布了一项名为 BIGCity 的时空大模型。提出了了一种统一轨迹和交通状态预测任务的新范式。本文第一作者为北京航空航天大学计算机学院博士生于勰，本文的通讯作
阅读全文
ICML 2025 | 从“浅对齐”到“深思熟虑”，清华牵头搭起大模型安全的下一级阶梯
作者：PaperWeekly发布日期：2025-07-03 22:06:35
在大语言模型（LLM）加速进入法律、医疗、金融等高风险应用场景的当下，“安全对齐”不再只是一个选项，而是每一位模型开发者与 AI 落地者都必须正面应对的挑战。然而，如今广泛采用的对齐方式，往往只是让
阅读全文
北京内推 | 京东探索研究院基础大模型团队招聘大模型算法实习生
作者：PaperWeekly发布日期：2025-07-03 22:06:35
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！京东集团京东集团探索研究院负责京东集团基础大模型的全链路实现，包括基座模型、预
阅读全文
ICML 2025 | 从“开盲盒”到“精准推演”：LensLLM理论透视微调相变，终结大模型选型玄学
作者：PaperWeekly发布日期：2025-06-23 21:33:34
还在为海量 LLM 如何高效选型而头疼？还在苦恼资源有限无法穷尽所有微调可能？来自弗吉尼亚理工大学的最新研究，提出 LensLLM 框架，不仅能精准预测大模型微调性能，更大幅降低计算成本，让 LLM
阅读全文
告别Softmax缺陷！LogTokU四象限框架用证据强度根治LLM幻觉
作者：PaperWeekly发布日期：2025-06-23 21:33:34
大语言模型（LLMs）常面临“幻觉”问题，输出不可靠信息。不确定性估计作为评估模型输出可靠性的关键指标，对于提升 LLM 可信度、支撑下游任务至关重要。然而，传统基于概率的不确定性估计方法难以有效捕捉
阅读全文
TIP 2025 | 从噪声图像到精准报告：CMCRL两阶段因果框架重构医疗多模态学习
作者：PaperWeekly发布日期：2025-06-23 21:33:34
论文地址：https://ieeexplore.ieee.org/document/11005686Arxiv地址：https://arxiv.org/abs/2303.09117CMCRL 仓库：h
阅读全文
博士申请 | 香港科技大学计算机系周铭洵老师招收隐私安全计算全奖博士/硕士/RA
作者：PaperWeekly发布日期：2025-06-23 21:33:34
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港科技大学香港科技大学（The Hong Kong University o
阅读全文
碾压DeepSeek推理4倍！MiniMax M1百万token长文屠榜，开源登顶全球前二
作者：PaperWeekly发布日期：2025-06-19 14:01:44
近日，MiniMax 正式开启 #MiniMaxWeek 技术周，第一弹重磅发布全新 M1 模型！M1 模型在训练与推理效率方面实现了显著提升。RL训练成本仅需 53.3 万美元，推理效率提升至 De
阅读全文
ACL 2025 | 大模型“以讹传讹”？DRAG双阶段「多代理辩论」破解幻觉叠加问题
作者：PaperWeekly发布日期：2025-06-19 14:01:44
近年来，GPT 等大型语言模型在问答、搜索、医疗等任务中大放异彩，但一个顽疾始终存在——幻觉（hallucination），即模型自信输出却偏离事实。为缓解幻觉，学界提出了 RAG（Retrieval
阅读全文
训练无关、即插即用！北大DyFo刷新视觉搜索能力，解锁MLLM细粒度理解新高度
作者：PaperWeekly发布日期：2025-06-19 14:01:44
今天给大家带来北京大学彭宇新团队教授的最新工作，一种训练无关的动态聚焦视觉搜索方法，论文已被 CVPR 2025 接收为 Highlight（前 13.5%）并完全开源。论文标题：DyFo: A Tr
阅读全文
杭州/北京内推 | 阿里虎鲸文娱搜索QP团队招聘大模型算法实习生
作者：PaperWeekly发布日期：2025-06-19 14:01:44
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！阿里巴巴阿里虎鲸文娱搜索QP团队，负责优酷多端搜索query理解，多语种翻译等
阅读全文
比Transformer还快？闭环递归Comba登场！标量低秩变换加速前向传播，CV/NLP齐夺SOTA
作者：PaperWeekly发布日期：2025-06-18 21:32:01
近日由香港科技大学广州与上海 AI Lab 联合发布了一项研究成果：Improving Bilinear RNNs with Closed-loop Control，该文章首先对最近高效序列建模方法，
阅读全文
ACL 2025 | 深入浅出看关系：探索多模态大模型关系“幻觉”问题
作者：PaperWeekly发布日期：2025-06-18 21:32:01
什么是“关系幻觉”？如今，多模态大语言模型（MLLMs）已经在我们生活中随处可见，无论是聊天机器人还是自动驾驶，甚至是医疗诊断，都有它们的身影。然而，这些模型有时却会“编故事”，做出与现实不符的错误回
阅读全文
你的T2I模型真的看懂了你的Prompt吗？TIIF-Bench来了次摸底评测！
作者：PaperWeekly发布日期：2025-06-18 21:32:01
论文标题：TIIF-Bench: How Does Your T2I Model Follow Your Instructions?作者单位：北京大学、清华大学、中山大学、香港理工大学、OPPO Y-
阅读全文
博士申请 | 香港理工大学计算机系郭径材老师招收人工智能/机器学习全奖博士/博后/实习生
作者：PaperWeekly发布日期：2025-06-18 21:32:01
合适的工作难找？最新的招聘信息也不知道？AI 求职为大家精选人工智能领域最新鲜的招聘信息，助你先人一步投递，快人一步入职！香港理工大学香港理工大学是一所位于香港特别行政区的公立综合性研究型大学, 坐落
阅读全文
读博士，去哪找那么多创新点？水水得了...
作者：PaperWeekly发布日期：2025-06-17 13:34:46
最近经常收到读者的留言 : 抱怨科研真是太难了，竞争压力大，导师不给指导、不开组会，一年见不到导师几次，对于论文初稿、毕业论文毫无建议! 其实他不是个例，大家也会有这样的烦恼：前沿顶会、期刊论文、综述
阅读全文
ICML 2025 | 北大KA-Prompt首创提示知识对齐范式，跨域推理不再“鸡同鸭讲”
作者：PaperWeekly发布日期：2025-06-17 13:34:46
领域增量学习（Domain Incremental Learning, DIL）要求模型在动态数据流中持续适应新领域（如风格变化、环境扰动），同时保留历史知识。传统 DIL 方法面临两难困境：一方面，
阅读全文