北京/上海内推 | 美团基座大模型团队招聘多模态/具身智能研究型实习生
合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团LongCat——美团基础大模型,不只聪明,更懂生活。从语言理解到全模态感
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团LongCat——美团基础大模型,不只聪明,更懂生活。从语言理解到全模态感
阅读全文机器人在现实中总“翻车”?只因跨不过那道模态鸿沟。今天,具身智能真正的 ImageNet 时刻终于到来。从 2025 年春晚的《秧 BOT》,到 2026 年春晚里走进武术、小品等不同节目,机器人已经
阅读全文TL;DR:本研究提出首个面向角色扮演模型泛化能力的信息论理解框架:通过 R-EMID 度量分布偏移下的性能退化,并形式化揭示用户、角色与对话组合偏移的影响机制。 论文标题:Understanding
阅读全文挑高光、对节拍、梳理剧情,这些繁琐的剪辑细活,CutClaw 现在一句话就能接过去。颠覆体验!AI 不止会拼接素材,更能听指令、卡节奏过去的视频自动剪辑方法,核心能力往往局限于文本对齐或画面高光提取。
阅读全文大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。HumanEval、SWE-Bench、ClassEval……榜单很多,但多数仍在考函数、类,或在既有仓库里打补丁。真正让人头疼的 0
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从机器遗忘到更广泛的模型调控 直播嘉宾 刘思佳密歇根州立大学杰出副教授MIT-IBM Watson AI Lab客座教授
阅读全文当 AI 智能体(Agent)从实验室走向现实,我们该如何确信它们在复杂场景下依然听话?近日,复旦大学、上海创智学院与牛津大学联合研究团队发表研究论文 AutoControl Arena,提出“逻辑-
阅读全文ClawKeeper 把技能、插件和 Watcher 接到一起,把 OpenClaw 安全从零散防护做成完整体系。近日,由北京邮电大学、北京智源人工智能研究院、中国信息通信研究院联合推出 ClawKe
阅读全文大模型其实“心里有数”,天生具备高效推理的潜能。论文标题:Does Your Reasoning Model Implicitly Know When to Stop Thinking?研究团队:北航
阅读全文现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性
阅读全文Advanced Computing 是一本聚焦计算机科学全领域的开放获取期刊,从理论基础、软件工程到人工智能、计算机视觉及新兴技术等方向,都属于其发表范畴。内容范围包括但不限于以下领域: 理论计算机
阅读全文LLM 长程(Long-horizon)Agent 在进行环境多轮交互时,容易陷入“越用越慢、越用越不稳”的困境:历史轨迹不断累积,Context 线性膨胀,Token 成本飙升,还会触发 “Lost
阅读全文随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,各种各样如 OpenClaw 的 agentic applications 正在成为当前研究与产业共同关注的核心方向。无论是在网页环境中进
阅读全文我们开始期待机器本身学会运行。若你也曾想过:“AI 最终会成为一种计算机”,那本文就是写给你的。过去几十年,计算机逐渐成为人类完成任务的重要媒介。最近几年,AI 也开始进入这个位置:它不再只回答问题,
阅读全文近年来,通用图像编辑模型已经能够在一定程度上完成表情修改。从“微笑”到“愤怒”,这些高层语义的编辑已经不再困难。但当我们希望进一步控制表情时,一个更本质的问题会逐渐显现:表情可以被改变,但仍然难以被精
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从Transformer到Alpha:构建可自我进化的金融AI智能体 直播嘉宾 孙卿云斯坦福大学数学博士AI 研究科学家
阅读全文比起包揽整个科研流程,Google 这次更现实。先把实验日志、Related Work 和成稿排版交给 agent。最近几个月,自动科研已经卷到有点让人头皮发麻了。从 The AI Scientist
阅读全文在预训练视觉语言模型(VLMs)的持续学习(Continual Learning)中,模型需要平衡三个相互竞争的目标:保留预训练的通用知识(前向稳定性)、保留之前学习任务的知识(后向稳定性),以及维持
阅读全文Skill 不再只是人写给 agent 的说明书。EvoSkills 试着证明,复杂任务里,AI 也能自己生成、修补并迭代出更管用的 skill。©PaperWeekly 原创 · 作者 | 张涵容单
阅读全文近日,港中文/蚂蚁集团在 ICLR 2026 提出了迄今为止规模最大、质量最高的音频理解选择题数据集 AudioMCQ,并基于 AudioMCQ 深入探究了音频-语言大模型的“音频贡献缺失”现象:即音
阅读全文谁能想到,银幕里一路打丧尸的 Alice,如今会和 Claude 一起做出一个开源 AI 记忆系统。说实话,第一次看到这个项目的时候,我们的第一反应不是技术,而是有点离谱。Milla Jovovich
阅读全文还记得我们熟悉的考试方式吗?一张试卷发给所有人,有人觉得太简单,有人做到怀疑人生,最后再用同一套分数去衡量每个人的能力。这种“千人一卷”的方式简单直接,但也有明显问题:题做了很多,却不一定测得准。有没
阅读全文Nature 公布了一封来自中国博二学生的求助信。长期缺乏指导与言语打压,已让这名学生确诊重度抑郁。近日,《Nature》职业专栏刊发了一封引人深思的求助信。写信人是一名在国内某高校就读环境科学与工程
阅读全文从 Genie 3 到 LingBot-World,世界模型正成为 AI 领域最热的方向之一。一个自然的问题是:如何让用户用最直觉的方式——手势——来驱动世界模型中的交互?我们提出了 Hand2Wor
阅读全文在 AI 语音交互的赛道上,南京大学联合腾讯音乐研发的 VITA-Qinyu 正式亮相。这是业内首款兼具自然对话、高表现力角色扮演与歌唱能力的开源端到端语音语言模型(SLM),一举打破了传统语音模型仅
阅读全文论文标题:OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens论文地址:https://arxiv.org/
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 小型开源多模态语言模型智能体及其在科学与社会中的应用 直播嘉宾 王璇弗吉尼亚理工大学助理教授伊利诺伊大学香槟分校博士 直
阅读全文我们很难预判大模型面对新任务会不会出错。这项刚登上 Nature 正刊的研究,终于给出了精准预测的量化标准。一位 00 后国人学者,刚刚再次以第一作者的身份登上《Nature》正刊。这篇论文尝试解决目
阅读全文当其他大厂还在卷跑分时,Anthropic 已经把大模型调教得越来越像一个“活人”了。因为一个忘了删除的 .map 测试映射文件,Anthropic 遭遇了史上最大规模的源码泄露。超 50 万行 Ty
阅读全文