上交大刘鹏飞团队:Context Engineering进入2.0,上下文成为可操作对象
我们早已习惯在提示词、记忆窗口、外部检索器之间调参,以期让模型理解更多上下文。可在上海交大刘鹏飞团队的最新论文中,上下文工程不再是工程师堆 token 的技巧,而是一个可被形式化的科学对象。他们称之为
阅读全文我们早已习惯在提示词、记忆窗口、外部检索器之间调参,以期让模型理解更多上下文。可在上海交大刘鹏飞团队的最新论文中,上下文工程不再是工程师堆 token 的技巧,而是一个可被形式化的科学对象。他们称之为
阅读全文随着技术与计算机科学等领域的迅猛发展,新研究层出不穷,在快速出版与内容深度之间取得平衡,成为学术图书面临的新挑战。数字化出版加快了修订节奏,使新成果得以及时纳入,而“小型图书”则提供了另一种解决方案,
阅读全文我们默认了两件事很久:语言模型应该逐 token 生成;加速只能靠算力。CALM 的关键在于——它质疑的是这两件事本身。在当前主流语言模型里,时间成本的基本单位是下一 token。这是一个我们长期习以
阅读全文当前 MLLM 擅长全局场景级理解与推理,在像素级细粒度视觉理解任务上仍表现薄弱。视觉语言理解已从整体场景级认知,迈向更细粒度的像素级目标级推理。然而,当下的研究工作多局限于单个物体的描述,难以深入理
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!美团美团的使命是“帮大家吃得更好,生活更好”,公司聚焦“零售 + 科技”战略,
阅读全文知乎/小红书上动不动就是 Strong Accept,但这并不是“学术界真实分布”。德州农工×康奈尔用跨平台数据实证:网上晒出来的分数,是被幸存者、抱怨者、边缘者三重力量系统性抬高的。别被那些截图刺到
阅读全文让机器人拥有“记忆”,是实现长时程任务的关键突破。然而,现有视觉-语言-动作(VLA)模型普遍存在“金鱼记忆”的局限——仅依赖当前瞬间的感知,缺乏对历史状态的建模,导致在需要判断“按钮是否已按下”这类
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南洋理工大学新加坡南洋理工大学是一所科研密集型大学,凭借科学与工程领域的坚实基
阅读全文MiniMax M2 发布这几天,最被聚焦的讨论并不在榜单截图,而是那个更关键的问题:Full Attention 到底能不能撑得住多跳 reasoning?M2 给出的结果,是“撑住了”。这一细节点
阅读全文基于功能的蛋白质设计任务(function-guided protein design)旨在根据功能描述或关键词,生成符合的蛋白质序列。其核心挑战在于,如何确保从蛋白质序列庞大空间中设计的序列既满足给
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室,主要负责通义系列大模型研究与产品落地。其中对话智能
阅读全文RL 微调训练时一切正常,为什么一上线就像换了个模型?这篇被 Andrej Karpathy 点赞的 NUS 研究给出一个极其反直觉的答案:不是模型退化,是你用的 BF16 在悄悄放大误差。这个现象不
阅读全文©作者 | 曾爽单位 | 西安交通大学硕士研究方向 | 具身智能、自动驾驶摘要精确的车道级拓扑图是高级别自动驾驶系统的关键基石,它为车辆的全局路径规划和决策提供了结构化信息。然而,现有方法在处理现实世
阅读全文强化学习似乎注定要沿时间一层层回传。但 Sergey Levine 团队发现,值函数并不需要回到过去——它可以被“对半合成”。Transitive RL 让强化学习第一次跳出了时间的诅咒。在强化学习中
阅读全文引言当你向 AI 咨询健康问题或寻求建议时,是否想过——它可能正在“违背本心”地欺骗你?最近一项由上海人工智能实验,复旦大学,中科大和上海交通大学联合发布的一项新研究揭示了一个隐蔽而危险的真相:一个看
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!快手我们是「快手模型与应用部-营收模型中心-增长模型团队」,致力于通过前沿算法
阅读全文当世界模型不再只是“预测视频”,而能真正理解并控制物理世界,机器人就能在虚拟空间中完成评估、优化与自我迭代。清华陈建宇团队 × 斯坦福 Chelsea Finn 课题组联合推出 Ctrl-World,
阅读全文©作者 | 汤昊单位 | 北京大学博士研究方向 | 统一多模态理解和生成研究动机统一的多模态模型需要视觉表征同时具备用于理解的丰富语义和用于生成/编辑的精细细节。像 VAE 这样的早期方法,因其特征缺
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!AMDAMD 是高性能与自适应计算领域的领先企业,致力于提供优质的产品和服务,
阅读全文人们一直以为,大模型的隐藏状态是抽象的“语义压缩”。但这篇论文发现,Transformer 并没有丢掉任何输入信息——它能凭隐藏状态精确反演出你说的每一个字。我们一直以为,语言模型的隐藏状态是对输入的
阅读全文AI 合照终于不再像贴纸了 🔥 这次,它真的能“在一起”了。过去的人脸参考生成,要么“不像”,要么“太像”。 一张图里的人物,表情僵硬、眼神复制、姿势割裂—— 明明是“合照”,却像几张贴纸凑在一起
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信事业群负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生
阅读全文在 3D 视觉领域,如何从二维图像快速、精准地恢复三维世界,一直是计算机视觉与计算机图形学最核心的问题之一。从早期的Structure-from-Motion (SfM) 到Neural Radian
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!University of Sheffield谢菲尔德大学(Universit
阅读全文过去,AI 只能“被训练”;现在,它开始“训练自己”。来自 LSTM 之父 Jürgen Schmidhuber 团队的最新研究,展示了一种能自我修改、自我修复、甚至自我优化的智能体——它真的开始学会
阅读全文©作者 | 章天任、陈冠宇、陈峰单位 | 清华大学 VIPLAB、千诀科技邮箱 | trzhang@mail.tsinghua.edu.cn相信 2025 年 AI 领域的大家都或多或少听说过“世界模
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!MBZUAI穆罕默德·本·扎耶德人工智能大学(Mohamed bin Zaye
阅读全文同样的后训练,RL 让模型更稳,SFT 却更健忘。普林斯顿陈丹琦团队发现,遗忘的根源不在算法,而在数据分布与模型行为之间的错位。随着大模型规模的不断扩大,后训练(post-training)已成为影响
阅读全文在视频生成的世界里,“认不清人”成了一个尴尬的通病。无论是两个人同框跳舞,还是多人合作演绎剧情,模型常常为了追求画面一致性而牺牲人物身份,一不留神就“串脸”“换人”。来自阿里云的研究团队决定正面破解这
阅读全文