全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    北京/上海内推 | 美团基座大模型团队招聘多模态/具身智能研究型实习生

    作者:PaperWeekly发布日期:2026-04-20 12:31:36

    合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团LongCat——美团基础大模型,不只聪明,更懂生活。从语言理解到全模态感

    阅读全文
  • 文章封面

    具身智能表征的ImageNet来了!机器人终于看懂了人类世界

    作者:PaperWeekly发布日期:2026-04-17 13:07:02

    机器人在现实中总“翻车”?只因跨不过那道模态鸿沟。今天,具身智能真正的 ImageNet 时刻终于到来。从 2025 年春晚的《秧 BOT》,到 2026 年春晚里走进武术、小品等不同节目,机器人已经

    阅读全文
  • 文章封面

    ACL 2026 | 通义首提R-EMID框架:形式化揭示角色扮演性能退化机制

    作者:PaperWeekly发布日期:2026-04-17 13:07:02

    TL;DR:本研究提出首个面向角色扮演模型泛化能力的信息论理解框架:通过 R-EMID 度量分布偏移下的性能退化,并形式化揭示用户、角色与对话组合偏移的影响机制。 论文标题:Understanding

    阅读全文
  • 文章封面

    一句话自动剪Vlog!连BGM都能丝滑卡点,CutClaw有点太会了

    作者:PaperWeekly发布日期:2026-04-16 19:45:48

    挑高光、对节拍、梳理剧情,这些繁琐的剪辑细活,CutClaw 现在一句话就能接过去。颠覆体验!AI 不止会拼接素材,更能听指令、卡节奏过去的视频自动剪辑方法,核心能力往往局限于文本对齐或画面高光提取。

    阅读全文
  • 文章封面

    ACL 2026 | 微软提出RepoGenesis:AI能从README生成完整仓库吗?

    作者:PaperWeekly发布日期:2026-04-16 19:45:48

    大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。HumanEval、SWE-Bench、ClassEval……榜单很多,但多数仍在考函数、类,或在既有仓库里打补丁。真正让人头疼的 0

    阅读全文
  • 文章封面

    直播预告 | 密歇根州立大学刘思佳教授:从机器遗忘到更广泛的模型调控

    作者:PaperWeekly发布日期:2026-04-16 19:45:48

    PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从机器遗忘到更广泛的模型调控 直播嘉宾 刘思佳密歇根州立大学杰出副教授MIT-IBM Watson AI Lab客座教授

    阅读全文
  • 文章封面

    星耀里约!逛完ICLR主会场,别错过蚂蚁这场学术派对

    作者:PaperWeekly发布日期:2026-04-15 12:32:36

    ▼ 点击阅读原文,一键报名

    阅读全文
  • 文章封面

    AI也有两幅面孔?复旦等最新研究:高压之下大模型集体变脸

    作者:PaperWeekly发布日期:2026-04-15 12:32:36

    当 AI 智能体(Agent)从实验室走向现实,我们该如何确信它们在复杂场景下依然听话?近日,复旦大学、上海创智学院与牛津大学联合研究团队发表研究论文 AutoControl Arena,提出“逻辑-

    阅读全文
  • 文章封面

    OpenClaw也要装“杀毒软件”?ClawKeeper盯住「龙虾」每一步

    作者:PaperWeekly发布日期:2026-04-14 14:31:24

    ClawKeeper 把技能、插件和 Watcher 接到一起,把 OpenClaw 安全从零散防护做成完整体系。近日,由北京邮电大学、北京智源人工智能研究院、中国信息通信研究院联合推出 ClawKe

    阅读全文
  • 文章封面

    长推理不一定更强:北航 × 字节提出SAGE-RL,挖出大模型隐藏天赋

    作者:PaperWeekly发布日期:2026-04-14 14:31:24

    大模型其实“心里有数”,天生具备高效推理的潜能。论文标题:Does Your Reasoning Model Implicitly Know When to Stop Thinking?研究团队:北航

    阅读全文
  • 文章封面

    屡刷高分却不实用?南大团队揭示最强模型实际仅得49分

    作者:PaperWeekly发布日期:2026-04-13 18:33:26

    现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性

    阅读全文
  • 文章封面

    Advanced Computing 正式启航,聚焦计算机科学全领域,现已开放投稿!

    作者:PaperWeekly发布日期:2026-04-13 18:33:26

    Advanced Computing 是一本聚焦计算机科学全领域的开放获取期刊,从理论基础、软件工程到人工智能、计算机视觉及新兴技术等方向,都属于其发表范畴。内容范围包括但不限于以下领域: 理论计算机

    阅读全文
  • 文章封面

    1/3 Token↓,3×性能↑:通义 × 清华用强化学习重做Agent Memory

    作者:PaperWeekly发布日期:2026-04-11 20:50:09

    LLM 长程(Long-horizon)Agent 在进行环境多轮交互时,容易陷入“越用越慢、越用越不稳”的困境:历史轨迹不断累积,Context 线性膨胀,Token 成本飙升,还会触发 “Lost

    阅读全文
  • 文章封面

    ICLR 2026 | 多轮推理越走越偏,T3让Agent找回主动思考

    作者:PaperWeekly发布日期:2026-04-11 20:50:09

    随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,各种各样如 OpenClaw 的 agentic applications 正在成为当前研究与产业共同关注的核心方向。无论是在网页环境中进

    阅读全文
  • 文章封面

    Meta押注Neural Computers:下一代计算机,就是模型本身?

    作者:PaperWeekly发布日期:2026-04-10 14:35:37

    我们开始期待机器本身学会运行。若你也曾想过:“AI 最终会成为一种计算机”,那本文就是写给你的。过去几十年,计算机逐渐成为人类完成任务的重要媒介。最近几年,AI 也开始进入这个位置:它不再只回答问题,

    阅读全文
  • 文章封面

    复旦大学 × StepFun开源PixelSmile:让人脸表情迈向连续可控

    作者:PaperWeekly发布日期:2026-04-10 14:35:37

    近年来,通用图像编辑模型已经能够在一定程度上完成表情修改。从“微笑”到“愤怒”,这些高层语义的编辑已经不再困难。但当我们希望进一步控制表情时,一个更本质的问题会逐渐显现:表情可以被改变,但仍然难以被精

    阅读全文
  • 文章封面

    直播预告 | 斯坦福大学孙卿云博士:构建可自我进化的金融AI智能体

    作者:PaperWeekly发布日期:2026-04-10 14:35:37

    PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从Transformer到Alpha:构建可自我进化的金融AI智能体 直播嘉宾 孙卿云斯坦福大学数学博士AI 研究科学家

    阅读全文
  • 文章封面

    只给实验日志,一键吐出顶会LaTeX成稿,Google这波有点狠

    作者:PaperWeekly发布日期:2026-04-09 20:12:34

    比起包揽整个科研流程,Google 这次更现实。先把实验日志、Related Work 和成稿排版交给 agent。最近几个月,自动科研已经卷到有点让人头皮发麻了。从 The AI Scientist

    阅读全文
  • 文章封面

    ICLR 2026 | VLM持续学习怎么抗遗忘?KeepLoRA从参数子空间入手

    作者:PaperWeekly发布日期:2026-04-09 20:12:34

    在预训练视觉语言模型(VLMs)的持续学习(Continual Learning)中,模型需要平衡三个相互竞争的目标:保留预训练的通用知识(前向稳定性)、保留之前学习任务的知识(后向稳定性),以及维持

    阅读全文
  • 文章封面

    还在手搓工作流?EvoSkills开卷,AI开始自己爆改skill

    作者:PaperWeekly发布日期:2026-04-08 18:14:58

    Skill 不再只是人写给 agent 的说明书。EvoSkills 试着证明,复杂任务里,AI 也能自己生成、修补并迭代出更管用的 skill。©PaperWeekly 原创 · 作者 | 张涵容单

    阅读全文
  • 文章封面

    ICLR 2026 | 「音频贡献」成关键变量,音频大模型后训练迎来新范式

    作者:PaperWeekly发布日期:2026-04-08 18:14:58

    近日,港中文/蚂蚁集团在 ICLR 2026 提出了迄今为止规模最大、质量最高的音频理解选择题数据集 AudioMCQ,并基于 AudioMCQ 深入探究了音频-语言大模型的“音频贡献缺失”现象:即音

    阅读全文
  • 文章封面

    不打丧尸改写代码,《生化危机》女主开源 AI 记忆系统

    作者:PaperWeekly发布日期:2026-04-07 15:58:45

    谁能想到,银幕里一路打丧尸的 Alice,如今会和 Claude 一起做出一个开源 AI 记忆系统。说实话,第一次看到这个项目的时候,我们的第一反应不是技术,而是有点离谱。Milla Jovovich

    阅读全文
  • 文章封面

    TPAMI 2026 | 当考试开始“因人出题”:中科大发布首篇自适应测评综述

    作者:PaperWeekly发布日期:2026-04-07 15:58:45

    还记得我们熟悉的考试方式吗?一张试卷发给所有人,有人觉得太简单,有人做到怀疑人生,最后再用同一套分数去衡量每个人的能力。这种“千人一卷”的方式简单直接,但也有明显问题:题做了很多,却不一定测得准。有没

    阅读全文
  • 文章封面

    中国博二学生向Nature求救:导师骂我不如硕士,该退学吗?

    作者:PaperWeekly发布日期:2026-04-06 12:34:53

    Nature 公布了一封来自中国博二学生的求助信。长期缺乏指导与言语打压,已让这名学生确诊重度抑郁。近日,《Nature》职业专栏刊发了一封引人深思的求助信。写信人是一名在国内某高校就读环境科学与工程

    阅读全文
  • 文章封面

    NTU发布世界模型交互新范式:把手伸进屏幕不再是梦

    作者:PaperWeekly发布日期:2026-04-06 12:34:53

    从 Genie 3 到 LingBot-World,世界模型正成为 AI 领域最热的方向之一。一个自然的问题是:如何让用户用最直觉的方式——手势——来驱动世界模型中的交互?我们提出了 Hand2Wor

    阅读全文
  • 文章封面

    南京大学发布开源语音大模型VITA-Qinyu,首发支持角色扮演+哼唱

    作者:PaperWeekly发布日期:2026-04-03 12:36:13

    在 AI 语音交互的赛道上,南京大学联合腾讯音乐研发的 VITA-Qinyu 正式亮相。这是业内首款兼具自然对话、高表现力角色扮演与歌唱能力的开源端到端语音语言模型(SLM),一举打破了传统语音模型仅

    阅读全文
  • 文章封面

    CVPR 2026 | 复旦开源OmniLottie:首个端到端多模态矢量动画生成框架

    作者:PaperWeekly发布日期:2026-04-03 12:36:13

    论文标题:OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens论文地址:https://arxiv.org/

    阅读全文
  • 文章封面

    直播预告 | Virginia Tech王璇教授:小型多模态智能体的构建与应用

    作者:PaperWeekly发布日期:2026-04-03 12:36:13

    PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 小型开源多模态语言模型智能体及其在科学与社会中的应用 直播嘉宾 王璇弗吉尼亚理工大学助理教授伊利诺伊大学香槟分校博士 直

    阅读全文
  • 文章封面

    00后国人一作再发Nature:大模型新任务表现如何,现在能精准预测了

    作者:PaperWeekly发布日期:2026-04-02 13:52:54

    我们很难预判大模型面对新任务会不会出错。这项刚登上 Nature 正刊的研究,终于给出了精准预测的量化标准。一位 00 后国人学者,刚刚再次以第一作者的身份登上《Nature》正刊。这篇论文尝试解决目

    阅读全文
  • 文章封面

    Claude Code泄露的源码里,藏着一套让AI学会「做梦」的记忆架构

    作者:PaperWeekly发布日期:2026-04-01 18:50:26

    当其他大厂还在卷跑分时,Anthropic 已经把大模型调教得越来越像一个“活人”了。因为一个忘了删除的 .map 测试映射文件,Anthropic 遭遇了史上最大规模的源码泄露。超 50 万行 Ty

    阅读全文
上一页下一页