推理加持的排序SOTA!把“召回+相似度”写进RL,文档排序更稳更准
推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档
阅读全文推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港中文大学(深圳)香港中文大学(深圳)是一所经教育部批准,参照中外合作办学条
阅读全文发不出顶会顶刊,不是因为你不够努力,而是因为你仍在沿用那套低效、耗时的传统科研模式!传统模式要求你“从0到1”搞出一个极具创新的idea,然后花大量时间去验证、实现。这种模式对于科研新手来说,失败概率
阅读全文多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。比如,「一个玩具被
阅读全文近几年,空间音频从“更高质量到音频”走向“可被理解与生成的三维声场”。它不只是把声音变“立体”,而是让系统理解声源的方位、距离、运动,并能按需生成。在 AR/VR、影视、游戏与交互内容的牵引下,研究重
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队负责夸克教育多模态大模型的建设工作,有机会接触到前沿的多模态大模型
阅读全文前段时间由谷歌 Deepmind 组织的 AI 象棋大战万众瞩目,最终由出自 OpenAI 的 O3 夺冠。事实上,用策略游戏的对战来评测大模型并不是第一次被提出,被 ACL 2025 接收的论文 G
阅读全文随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理
阅读全文尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软亚太研发集团成立于2006年1月18日,是微软在美国之外职能最完备的研
阅读全文本文第一作者为丁国峰,四川大学计算机学院 2024 级硕士研究生。研究方向为多模态检索、多模态理解,指导老师为彭玺教授。论文标题:Visual Abstraction: A Plug-and-Play
阅读全文深度神经网络之所以卓越,在于它能逐层提炼数据特征,把复杂的高维信息逐渐“压缩”为规整的低维几何结构。但这种学习过程究竟如何由非线性、噪声、学习率等多重因素共同涌现,长期缺乏直观统一的解释。近日,巴塞尔
阅读全文还在为跑不过别人的模型而头疼吗?ACM MM Asia(CCF-C)的 #BraveNewIdeas (BNI) Track 就是为你准备的! 会议时间:2025 年 12月 9 日到 12 月 12
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!北京大学北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、
阅读全文©作者 | 白强伟单位 | 熵基科技研究方向 | 强化学习在大语言模型推理与强化学习研究中,如何直接优化 Pass@K 指标一直是核心挑战。来自 Google DeepMind 的作者团队在他们的最新
阅读全文腾讯 ARC Lab 联合中科院自动化所、香港城市大学、浙江大学等机构提出 TokLIP,在视觉 token 与统一多模态理解生成之间,架起了一座语义桥梁,训练数据量仅需同类方法的 20%,还可以在图
阅读全文©作者 | 张彧单位 | 浙江大学研究方向 | 音乐/空间音频歌曲生成的核心是基于各种提示生成可控的高质量歌曲。然而,现有方法难以生成具有提示控制的人声和伴奏,且不能实现两者间很好的对齐。此外,它们在
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!联想研究院团队专注于自研时序预测基础模型、预测智能体、时序推理模型与因果分析等
阅读全文近期,OpenAI 通过推出 GPT-5 打响了大模型降本增效的第一枪:在多个挑战性数据集上创下新高的同时,相比 Gemini 和 Claude 大幅降低了使用成本。为此,GPT-5 首次引入多模型路
阅读全文论文题目:Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection论文机构:Shanghai A
阅读全文随着 AI 技术的飞速发展,从「快思考」到 「慢思考」,大语言模型(LLMs)在处理复杂推理任务上展现出惊人的能力。无论是我们熟知的思维链(CoT),还是更复杂的深度思考模式(Thinking),都让
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软微软DKI (data knowledge intelligence) 大
阅读全文©作者 | 王磊过去两年,大模型的焦点几乎都落在“如何更快、更大地训练”,而随着 Llama2、Qwen、Mistral 等开源模型的接连登场,推理优化的战场骤然升温。2023 下半年起,从算子融合、
阅读全文大模型饱受“幻觉”困扰。大模型有时会给出错误答案却不自知,甚至“一本正经地胡说八道”,将错误隐藏的更深。如何刻画模型回答的可靠性,成为解决大模型“幻觉”的关键。牛津大学发表在 Nature 上的语义熵
阅读全文“大模型能解高数题了,但它是真的理解了数学概念,还是只背会了题库套路?”随着大语言模型(LLMs)在数学领域的应用越来越广,“模型是否真的具备数学推理能力” 成了学界热议的焦点。现在的训练模式大多让模
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!新加坡管理大学新加坡管理大学(Singapore Management Uni
阅读全文近日,通义实验室发布了 GUI-Owl 和基于 GUI-Owl 的强大多智能体协同框架 Mobile-Agent-v3。它不仅能独立完成复杂的 GUI 任务,同时可以单独负责不同的角色,如问答、描述、
阅读全文随着人工智能技术的不断演进,大语言模型正逐步从简单的“快思考”模式,转向更注重推理深度与逻辑连贯性的“慢思考”范式。以 DeepSeek-R1 为代表的新型大模型,通过引入强化学习机制强化长思维链推理
阅读全文©作者 | 孙伟高单位 | 上海人工智能实验室近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gem
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!百度百度文心(ERNIE)团队致力于预训练大模型基础技术的研究和应用,在预训练
阅读全文