全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    推理加持的排序SOTA!把“召回+相似度”写进RL,文档排序更稳更准

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档

    阅读全文
  • 文章封面

    博士申请 | 香港中文大学(深圳)游宇宁老师招收人工智能+生物医药全奖博士/实习生

    作者:PaperWeekly发布日期:2025-09-05 13:05:22

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)是一所经教育部批准,参照中外合作办学条

    阅读全文
  • 文章封面

    拜读了某大佬发表的N篇顶会,原来论文“灌水”是这么玩的

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    发不出顶会顶刊,不是因为你不够努力,而是因为你仍在沿用那套低效、耗时的传统科研模式!传统模式要求你“从0到1”搞出一个极具创新的idea,然后花大量时间去验证、实现。这种模式对于科研新手来说,失败概率

    阅读全文
  • 文章封面

    多模态大模型,真的“懂”世界吗?ICML 2025高分论文实锤核心认知盲区

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。比如,「一个玩具被

    阅读全文
  • 文章封面

    听见空间!ASAudio全景综述:空间音频表示→理解→生成全链路

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    近几年,空间音频从“更高质量到音频”走向“可被理解与生成的三维声场”。它不只是把声音变“立体”,而是让系统理解声源的方位、距离、运动,并能按需生成。在 AR/VR、影视、游戏与交互内容的牵引下,研究重

    阅读全文
  • 文章封面

    北京内推 | 阿里夸克教育团队招聘推荐大模型数据算法实习生

    作者:PaperWeekly发布日期:2025-09-04 12:31:56

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队负责夸克教育多模态大模型的建设工作,有机会接触到前沿的多模态大模型

    阅读全文
  • 文章封面

    Benchmark新试炼场!从棋盘到德扑全覆盖,GAMEBoT虐测大模型推理力

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    前段时间由谷歌 Deepmind 组织的 AI 象棋大战万众瞩目,最终由出自 OpenAI 的 O3 夺冠。事实上,用策略游戏的对战来评测大模型并不是第一次被提出,被 ACL 2025 接收的论文 G

    阅读全文
  • 文章封面

    【9月9日直播】大模型复杂推理技术:如何重塑AI推理逻辑

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理

    阅读全文
  • 文章封面

    原子思维上线!Agentic Deep Research再进化:推理更深、答案更准

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统

    阅读全文
  • 文章封面

    北京/苏州内推 | 微软亚太研发集团招聘AI智能预测实习生

    作者:PaperWeekly发布日期:2025-09-03 13:11:54

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软亚太研发集团成立于2006年1月18日,是微软在美国之外职能最完备的研

    阅读全文
  • 文章封面

    ICML 2025 | 从联合空间到文本空间:测试时增强跨模态检索新范式

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    本文第一作者为丁国峰,四川大学计算机学院 2024 级硕士研究生。研究方向为多模态检索、多模态理解,指导老师为彭玺教授。论文标题:Visual Abstraction: A Plug-and-Play

    阅读全文
  • 文章封面

    经典机械物理模型 × 深度学习:揭开神经网络特征学习的秘密

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    深度神经网络之所以卓越,在于它能逐层提炼数据特征,把复杂的高维信息逐渐“压缩”为规整的低维几何结构。但这种学习过程究竟如何由非线性、噪声、学习率等多重因素共同涌现,长期缺乏直观统一的解释。近日,巴塞尔

    阅读全文
  • 文章封面

    ACM MM Asia火热征稿中!低年级PhD友好,不卷SOTA只看新意

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    还在为跑不过别人的模型而头疼吗?ACM MM Asia(CCF-C)的 #BraveNewIdeas (BNI) Track 就是为你准备的! 会议时间:2025 年 12月 9 日到 12 月 12

    阅读全文
  • 文章封面

    博士申请 | 北京大学计算机学院-中国电信招收计算机视觉方向联培博士生

    作者:PaperWeekly发布日期:2025-09-02 14:17:04

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、

    阅读全文
  • 文章封面

    GRPO偷偷优化Pass@K?从0-1奖励到无偏策略,DeepMind揭示全面解法

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    ©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习在大语言模型推理与强化学习研究中,如何直接优化 Pass@K 指标一直是核心挑战。来自 Google DeepMind 的作者团队在他们的最新

    阅读全文
  • 文章封面

    让图像会说话!视觉Token注入CLIP语义,TokLIP重塑多模态理解与生成

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    腾讯 ARC Lab 联合中科院自动化所、香港城市大学、浙江大学等机构提出 TokLIP,在视觉 token 与统一多模态理解生成之间,架起了一座语义桥梁,训练数据量仅需同类方法的 20%,还可以在图

    阅读全文
  • 文章封面

    EMNLP 2025|人声解耦×伴奏对齐!浙大VersBand打造提示可控的歌曲生成框架

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    ©作者 | 张彧单位 | 浙江大学研究方向 | 音乐/空间音频歌曲生成的核心是基于各种提示生成可控的高质量歌曲。然而,现有方法难以生成具有提示控制的人声和伴奏,且不能实现两者间很好的对齐。此外,它们在

    阅读全文
  • 文章封面

    北京内推 | 联想研究院AI Lab招聘大模型算法实习生

    作者:PaperWeekly发布日期:2025-09-01 23:10:18

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!联想研究院团队专注于自研时序预测基础模型、预测智能体、时序推理模型与因果分析等

    阅读全文
  • 文章封面

    性能超越GPT-5,成本减30%!大模型装上智能路由,Avengers-Pro刷新性价比极限

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    近期,OpenAI 通过推出 GPT-5 打响了大模型降本增效的第一枪:在多个挑战性数据集上创下新高的同时,相比 Gemini 和 Claude 大幅降低了使用成本。为此,GPT-5 首次引入多模型路

    阅读全文
  • 文章封面

    EMNLP 2025 | 看图就越狱!视觉上下文攻击:“图像语境”一招撬开多模态大模型

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    论文题目:Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection论文机构:Shanghai A

    阅读全文
  • 文章封面

    动态压缩CoT!浙大×蚂蚁发布LightThinker,让模型推理“轻起来”

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    随着 AI 技术的飞速发展,从「快思考」到 「慢思考」,大语言模型(LLMs)在处理复杂推理任务上展现出惊人的能力。无论是我们熟知的思维链(CoT),还是更复杂的深度思考模式(Thinking),都让

    阅读全文
  • 文章封面

    北京内推 | 微软DKI大模型团队招聘大模型/Agent/广告推荐方向研究型实习生

    作者:PaperWeekly发布日期:2025-08-31 23:55:07

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软DKI (data knowledge intelligence) 大

    阅读全文
  • 文章封面

    大模型推理上半场收官:单实例优化见顶,迈向低时延×长上下文

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    ©作者 | 王磊过去两年,大模型的焦点几乎都落在“如何更快、更大地训练”,而随着 Llama2、Qwen、Mistral 等开源模型的接连登场,推理优化的战场骤然升温。2023 下半年起,从算子融合、

    阅读全文
  • 文章封面

    绕过Softmax!「语义能量」替代语义熵,大模型幻觉检测迎来新突破

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    大模型饱受“幻觉”困扰。大模型有时会给出错误答案却不自知,甚至“一本正经地胡说八道”,将错误隐藏的更深。如何刻画模型回答的可靠性,成为解决大模型“幻觉”的关键。牛津大学发表在 Nature 上的语义熵

    阅读全文
  • 文章封面

    ICML 2025 | 会做题≠会思考?首个反例驱动推理基准:揭穿大模型“刷题式假象”

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    “大模型能解高数题了,但它是真的理解了数学概念,还是只背会了题库套路?”随着大语言模型(LLMs)在数学领域的应用越来越广,“模型是否真的具备数学推理能力” 成了学界热议的焦点。现在的训练模式大多让模

    阅读全文
  • 文章封面

    博士申请 | 新加坡管理大学(SMU)何盛烽团队招收计算机视觉全奖博士/博后

    作者:PaperWeekly发布日期:2025-08-28 22:08:34

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡管理大学新加坡管理大学(Singapore Management Uni

    阅读全文
  • 文章封面

    横扫GUI十大榜单!通义重磅开源Mobile-Agent-v3,多智能体协作神器登场

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    近日,通义实验室发布了 GUI-Owl 和基于 GUI-Owl 的强大多智能体协同框架 Mobile-Agent-v3。它不仅能独立完成复杂的 GUI 任务,同时可以单独负责不同的角色,如问答、描述、

    阅读全文
  • 文章封面

    直播预告 | 人大高瓴赵鑫教授:AI慢思考与大模型复杂推理

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理

    阅读全文
  • 文章封面

    唯快不破!400+篇文献精炼:从Flash到MoE,大模型高效架构全景解析

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    ©作者 | 孙伟高单位 | 上海人工智能实验室近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gem

    阅读全文
  • 文章封面

    北京内推 | 百度自然语言处理部招聘文心一言大模型算法实习生

    作者:PaperWeekly发布日期:2025-08-27 13:07:47

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练

    阅读全文
上一页下一页