全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    博士申请 | 纽约大学(上海)计算机系谭桥宇老师招收LLM/MLLM方向全奖博士生

    作者:PaperWeekly发布日期:2025-06-10 13:45:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!纽约大学(上海)上海纽约大学(New York University Shan

    阅读全文
  • 文章封面

    导师放养,偷偷发了顶会……

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量

    阅读全文
  • 文章封面

    ICML 2025 | 抛弃全量微调!北大提出VGP范式,语义低秩分解解锁ViG高效迁移

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    近日,北京大学在图神经网络(GNN)视觉建模方向提出全新方法 VGP(Vision Graph Prompting),通过语义低秩分解(Semantic Low-Rank Decomposition)

    阅读全文
  • 文章封面

    推理能力飙升,指令遵循暴跌?MathIF基准揭示大模型“服从性漏洞”

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    如果面前有两个 AI 助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选?最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing

    阅读全文
  • 文章封面

    CogMAEC@ACM MM 2025火热征稿中!探索多模态共情智能的认知密码

    作者:PaperWeekly发布日期:2025-06-09 13:33:58

    当情感计算从“识别情绪”迈向“理解情绪背后的认知机制”,认知智能正成为下一代情感计算的重要突破口。CogMAEC(Cognition-oriented Multimodal Affective and

    阅读全文
  • 文章封面

    SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    论文标题DeepCritic: Deliberate Critique with Large Language Models论文链接:https://arxiv.org/abs/2505.00662代

    阅读全文
  • 文章封面

    既ZeroSearch之后,通义最新力作MaskSearch提出推理搜索预训练新框架

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    引言当下,推理与搜索深度融合的模型范式成为 AI 研究的前沿热点。大模型通过在推理过程中灵活调用搜索工具,精准获取关键信息并驱动后续推理,为攻克复杂任务开辟了新路径。通义实验室搜索团队此前的 Zero

    阅读全文
  • 文章封面

    35%准确率蒸发!字节&华科WildDoc揭示多模态文档理解鲁棒性短板

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    在文档理解领域,多模态大模型(MLLMs)正以惊人的速度进化。从基础文档图像识别到复杂文档理解,它们在扫描或数字文档基准测试(如 DocVQA、ChartQA)中表现出色,这似乎表明 MLLMs 已很

    阅读全文
  • 文章封面

    博士申请 | 香港教育大学徐贯东教授招收LLM Agent/多模态大模型方向博士/博后/RA

    作者:PaperWeekly发布日期:2025-06-07 23:55:13

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港教育大学香港教育大学是香港大学资助委员会(UGC)下属的八所公立大学之一,

    阅读全文
  • 文章封面

    近千篇文献淬炼!哈工大领衔发布首篇长思维链综述:重构大模型推理能力边界

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    从语言理解到逻辑推理:AI 正驶入“深入思考”的拐点近年来,大语言模型(LLMs)在自然语言处理任务中屡创佳绩,但真正推动它们迈入智能进化新阶段的,是一种更具层次性的推理方式:长思维链(Long Ch

    阅读全文
  • 文章封面

    ICML 2025 | 北大团队提出GAPrompt:仅用2%参数,点云模型精度媲美全量微调

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    近日北京大学联合浙江大学、华中科技大学发布了一项最新研究成果:GAPrompt(Geometry-Aware Point Cloud Prompt),即一种面向三维视觉预训练模型的几何感知高效微调方法

    阅读全文
  • 文章封面

    告别O(n²)!上海AI Lab开源Linear-MoE:线性注意力+MoE的终极缝合术

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    近年来随着大语言模型的爆火,旨在取代 Transformer 的高效模型架构及其预训练成为大模型领域的研究热点,主要包括线性序列建模(如 Linear Attention、SSM、Linear RNN

    阅读全文
  • 文章封面

    北京/上海/深圳内推 | 英伟达解决方案架构师高校科研团队招聘AI4Science方向实习生

    作者:PaperWeekly发布日期:2025-06-06 13:42:55

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!NVIDIANVIDIA is widely considered to be

    阅读全文
  • 文章封面

    强得离谱!CNN顶流回归,真·杀疯了

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    ❓当传统CNN遭遇算力瓶颈,神经压缩技术如何将模型缩小50倍❓液态网络如何模仿人脑实现毫秒级动态响应❓边界注意力怎样突破医疗影像的亚毫米级分割极限如果你对深度学习感兴趣,尤其是卷积神经网络(CNN)和

    阅读全文
  • 文章封面

    让AI也会“权衡利弊”?DecisionFlow让大模型更懂高风险决策!

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    在大模型的时代,我们早已习惯了它们在聊天、写作、编程等方面的强大能力。但你有没有想过:如果让大模型做“决策”,特别是对于普通人来说两难的决定——比如选哪个病人先抢救、种哪种水果最赚钱、买哪只股票更稳妥

    阅读全文
  • 文章封面

    SIGIR 2025 | Debug你的AI搜索!NExT-Search双模式反馈让模型学会自我纠错

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    以大语言模型(LLMs)为基础的生成式AI搜索正在重塑信息获取的方式,为用户提供了端到端的答案,极大地降低了用户手动浏览与总结多个网页的繁琐时间成本。然而,虽然这种新范式提升了便捷性,却也破坏了传统网

    阅读全文
  • 文章封面

    北京内推 | 京东广告部招聘NLP/大模型算法实习生

    作者:PaperWeekly发布日期:2025-06-05 13:32:33

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!京东京东广告部是京东的核心技术和业务部门,承担全站流量变现、收入提升的重要职责

    阅读全文
  • 文章封面

    告别「烧显卡」训练!上交大团队发布AutoGnothi:黑盒Transformer实现自我解释

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    ©PaperWeekly 原创 · 作者 | 张林峰单位 | 上海交通大学人工智能学院背景随着人工智能的广泛应用,尤其在视觉和语言处理领域,模型的可解释性变得至关重要。在高风险场景(如医疗和金融)中,

    阅读全文
  • 文章封面

    ACL 2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    跨规模参数知识迁移PKT的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。

    阅读全文
  • 文章封面

    无需外部组件!DiT自表征对齐黑科技:扩散模型的高效进化密码

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    论文标题:Representation Alignment for Diffusion Transformers without External Components论文链接:https://arx

    阅读全文
  • 文章封面

    北京内推 | 快手可灵AI技术部招聘视频生成方向暑期算法实习生

    作者:PaperWeekly发布日期:2025-05-28 13:42:43

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手可灵AI技术部负责可灵生成式AI大模型的研发和应用,构建超大规模 AI 基

    阅读全文
  • 文章封面

    ICML 2025 | 又快又强的狮虎兽!仅20M词元微调,Transformer秒切线性RNN

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    近日上海 AI Lab 联合华南理工大学、香港科技大学(广州)、南京大学和香港中文大学发布了他们的一项研究成果:Liger(狮虎兽),即 Linearizing LLMs to gated recur

    阅读全文
  • 文章封面

    ICML 2025 | 用“人类考试法”戳破AI泡沫:构建能力导向的自适应测评新范式

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    随着大模型能力持续增强,仅通过观测各个 Benchmark 上的得分来判断一个模型是否真的聪明、值得信赖,可能远远不够。你是否知道:评估一个大模型完整跑完一套标准测试(如 HELM),可能耗时超过 4

    阅读全文
  • 文章封面

    长推理≠高精度!自适应切换“秒答”与“深思”:省Token与提精度的双赢哲学

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    引言推理能力的进步极大提升了大语言模型(LLMs)和多模态大语言模型(MLLMs)在各类任务中的表现。但过度依赖思维链(CoT)推理会降低模型性能,产生冗长输出,影响效率。研究发现,长 CoT 推理并

    阅读全文
  • 文章封面

    博后招募 | 南方科技大学-新加坡国立大学联合招收图像处理和深度学习方向博士后

    作者:PaperWeekly发布日期:2025-05-27 13:41:52

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的

    阅读全文
  • 文章封面

    社交直男逆袭!通义AMPO炼成“多面脑回路”智能体,自适应推理秒切4种人格

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    AI 智能体终于学会"灵活变通,察言观色"了!从直觉派到谋略家,让 GPT-4o 甘拜下风的社交高手是如何炼成的?最近,通义实验室的最新研究工作让 AI 智能体掌握了人类高深的社交艺术:四种思考模式的

    阅读全文
  • 文章封面

    告别刷榜内卷!清华×百度提出Feedbacker,开启LLM深度洞察新评估时代

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    论文标题:From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback论文地址:https

    阅读全文
  • 文章封面

    ICML 2025 | 无需训练!清华团队「一行代码」突破视频生成时长“魔咒”

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    自 OpenAI 发布 Sora 以来,视频生成领域迎来爆发式增长,AI 赋能内容创作的时代已然来临。去年 4 月,生数科技联合清华大学基于团队提出的首个扩散 Transformer 融合架构 U-V

    阅读全文
  • 文章封面

    北京/杭州/上海内推 | 阿里通义实验室招聘强化学习/Agent方向研究型实习生

    作者:PaperWeekly发布日期:2025-05-26 13:38:11

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴团队致力于强化学习和agent相关方向的关键技术研究。现招聘研究型实习

    阅读全文
  • 文章封面

    Transformer升级之路:多头潜在注意力机制(MLA)究竟好在哪里?

    作者:PaperWeekly发布日期:2025-05-22 14:07:00

    ©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络自从 DeepSeek 爆火后,它所提的 Attention 变体 MLA(Multi-head L

    阅读全文
上一页下一页