AI科技评论

对话关梦龙：他想用 Agent 拯救你手机里的 100G 废片
作者：AI科技评论发布日期：2026-05-13 18:00:00
把决策权交给 AI，为普通人当“嘴替”。作者丨成妍菁编辑丨董子博
阅读全文
从最优传输角度训练奖励模型：让 RLHF 学会「忽略错误偏好」丨ICML 2026
作者：AI科技评论发布日期：2026-05-13 18:00:00
SelectiveRM：从点对点拟合噪声偏好，转向带选择机制的分布对齐，重构奖励模型的训练目标。
阅读全文
去掉 VAE 之后，商汤用 8B 参数重新定义了开源生图的上限
作者：AI科技评论发布日期：2026-05-12 18:00:00
多模态理解与生成的真统一。作者丨吴海明编辑丨马晓宁梁丙鉴
阅读全文
CVPR 2026 视频模型趋势梳理：不止生成下一帧，更要理解下一步
作者：AI科技评论发布日期：2026-05-12 18:00:00
视频智能正从画面生成走向运动控制、动态建模、信号理解与真实场景应用。作者丨郑佳美编辑丨马晓宁
阅读全文
AI 会笑吗？BIGAI & 上交大团队：多模态大模型是否真的能 get 到视频笑点｜ACL 2026
作者：AI科技评论发布日期：2026-05-12 18:00:00
v-HUB 基准将视频幽默理解聚焦于视觉线索与环境声音驱动的无对白短视频场景，系统揭示当前模型从“看见视频”到“理解笑点”之间仍有显著差距。
阅读全文
腾讯AI Lab绝唱：30B模型击败万亿旗舰，靠的是让AI学会「预习」
作者：AI科技评论发布日期：2026-05-11 18:00:00
无需人工奖励，AI自主探索即能进化——解开无奖励原生自演进之谜。作者丨成仲轩编辑丨董子博
阅读全文
从「座上宾」到「主战场」：具身智能如何完成对计算机视觉的「范式夺权」？| CVPR 2026
作者：AI科技评论发布日期：2026-05-11 18:00:00
当机器从识别图像走向介入现实，视觉研究的边界也被重新划定。作者丨郑佳美编辑丨马晓宁
阅读全文
告别天价账单：端云协同与记忆革命，让 Agent 告别「烧钱时代」丨 GAIR Live 029
作者：AI科技评论发布日期：2026-05-10 20:25:37
当 Agent 不再是昂贵的实验品，而是像水和电一样的基础设施时，真正的 AI 时代才算真正降临。作者丨岑峰
阅读全文
港广科陈昶昊团队：只用一张 RGB 图像，让机器读懂室内 3D 空间丨CVPR 2026
作者：AI科技评论发布日期：2026-05-10 20:25:37
LegoOcc：无需语义体素标注，也能识别开放类别。作者丨郑佳美编辑丨岑峰
阅读全文
Agent 自己学 Skill，到底学得怎么样？CMU 首个系统性基准来了
作者：AI科技评论发布日期：2026-05-10 20:25:37
CMU和Amazon AGI推出首个Agent Skill持续学习系统性基准SkillLearnBench，把答案拆到了Skill 生成、调用、执行的每一层。
阅读全文
对话简智朱雁鸣：不卷模型卷基建，具身智能核心是读懂人的数据
作者：AI科技评论发布日期：2026-05-09 18:51:04
「自动化」是具身数据行业的第一竞争力。作者丨高景辉编辑丨马晓宁
阅读全文
CVPR 2026 3D 视觉前沿梳理：模型正在学会理解、生成和构建世界
作者：AI科技评论发布日期：2026-05-09 18:51:04
3D 视觉正从重建生成，走向空间理解、动态模拟与工程化应用。作者丨郑佳美编辑丨岑峰
阅读全文
具身智能的竞争，胜负手在数据供给能力
作者：AI科技评论发布日期：2026-05-08 11:19:45
具身机器人正迎来数据之战。
阅读全文
何恺明团队论文全景扫描：一场关于「生成范式」的多角度突破 | CVPR 2026
作者：AI科技评论发布日期：2026-05-08 11:19:45
高度依赖扩散模型的图像生成范式，正在被重新审视。作者丨陈淑瑜编辑丨岑峰
阅读全文
看完智平方创始人郭彦东的这场演讲，我对 VLA 又有信心了
作者：AI科技评论发布日期：2026-05-07 18:03:10
VLA没有终结，反而在持续变强。作者丨高景辉编辑丨马晓宁
阅读全文
百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，效果如何？
作者：AI科技评论发布日期：2026-05-06 17:30:00
链路闭环级别的稳定性，是办公 Agent 留在牌桌上的门票。作者丨吴海明黄毅硕编辑丨马晓宁梁丙鉴
阅读全文
独家｜不信人形的朱啸虎，又投了一家机器人公司
作者：AI科技评论发布日期：2026-05-06 17:30:00
瑆爝机器人完成数千万元天使轮融资，聚焦具身大脑方向。作者丨高景辉编辑丨马晓宁
阅读全文
为什么它石陈亦伦踏入具身河流
作者：AI科技评论发布日期：2026-05-02 12:08:41
热潮之下，它石的「第一性」思考。作者丨吴彤马晓宁编辑丨林觉民
阅读全文
魔法原子登陆硅谷，行业首个「自进化具身大脑」发布
作者：AI科技评论发布日期：2026-04-30 17:44:34
英伟达、亚马逊都来了。作者丨齐铖湧编辑丨马晓宁
阅读全文
CVPR 2026 动态视觉智能观察梳理：Benchmark 之外的新考题已经出现
作者：AI科技评论发布日期：2026-04-30 17:44:34
输入不再完整、目标不再固定，视觉模型开始面对真实世界。作者丨郑佳美编辑丨岑峰
阅读全文
图像编辑模型不止生成：BIGAI&上交大提出EAR范式，系统测试其视觉规划能力
作者：AI科技评论发布日期：2026-04-30 17:44:34
EAR 范式与 AMAZE 基准将视觉规划重构为单步图像编辑任务，揭示当前图像编辑模型可通过微调获得一定的视觉规划能力。
阅读全文
跨本体、长任务、可预测……Motubrain双榜登顶只是一个开始
作者：AI科技评论发布日期：2026-04-29 21:07:01
机器人离落地干活又近了一步。作者丨高景辉编辑丨马晓宁
阅读全文
CVPR 2026 生成式 AI 观察梳理：视觉模型开始重写默认设定
作者：AI科技评论发布日期：2026-04-29 21:07:01
从扩散控制到语义泛化，视觉 AI 进入范式重构期。作者丨郑佳美编辑丨岑峰
阅读全文
具身智能体操作系统PhyAgentOS，赋能全球Physical AI 技术挑战赛冠军
作者：AI科技评论发布日期：2026-04-29 21:07:01
PhyAgentOS 的“冠军级 Physical AI 底座”与开发者普惠之路迈向具身智能落地新纪元。
阅读全文
三年连下三癌，阿里AI跑通了多癌筛查
作者：AI科技评论发布日期：2026-04-28 13:09:21
医生说平扫CT上看不见癌——AI找到了。
阅读全文
MiniCPM-o 4.5 技术报告发布：全双工全模态 API 开放，RTX5070即可实时运行
作者：AI科技评论发布日期：2026-04-28 13:09:21
附 Windows / macOS 一键安装包，最低 12GB 显存 GPU 即可运行。
阅读全文
给 Happy Horse-1.0 讲完戏，我无痛当上导演了
作者：AI科技评论发布日期：2026-04-27 21:14:41
电影级内容引擎还是物理拟真，视频模型路线加速分化。作者丨孟一凡编辑丨梁丙鉴
阅读全文
CVPR 2026 多模态视觉智能全景梳理：从感知到推理的范式重写
作者：AI科技评论发布日期：2026-04-27 21:14:41
视觉智能：从单一感知能力，扩展为融合感知、认知与行动的一体化智能形态。作者丨郑佳美编辑丨岑峰
阅读全文
李力耘加入众擎，全栈智驾大脑与顶级人形本体的双向奔赴
作者：AI科技评论发布日期：2026-04-26 20:28:50
李力耘正式加入后，众擎补齐了具身智能的“全栈拼图”。作者丨高景辉编辑丨马晓宁
阅读全文
腾讯 AI · 五问丨混元的三年战争
作者：AI科技评论发布日期：2026-04-25 14:31:17
如果少走一半弯路，混元今天或许仍在业界第一梯队。作者丨董子博编辑丨林觉民
阅读全文