移动GUI智能体迈向实用化!全新验证器架构V-Droid,刷新任务成功率记录
新智元报道 编辑:LRST【新智元导读】移动GUI自动化智能体V-Droid采用「验证器驱动」架构,通过离散化动作空间并利用LLM评估候选动作,实现了高效决策。在AndroidWorld等多个基
阅读全文新智元报道 编辑:LRST【新智元导读】移动GUI自动化智能体V-Droid采用「验证器驱动」架构,通过离散化动作空间并利用LLM评估候选动作,实现了高效决策。在AndroidWorld等多个基
阅读全文新智元报道 编辑:编辑部 YZNH【新智元导读】就在刚刚,商汤第六代大模型震撼升级,强推理、强交互、长记忆能力拉满。更惊人的是,这个模型彻底了实现文本、图像和视频的原生融合,看一段几分钟柯南视频
阅读全文新智元报道 编辑:犀牛 英智【新智元导读】从海底的慢动作漂浮到战场的史诗旋转,这十个视频全是Google Veo 2的神来之笔!它能让你的点子秒变大片级画面,快来围观这场创意狂欢。就在刚刚结束的
阅读全文新智元报道 编辑:LRST【新智元导读】CFG-Zero*是由南洋理工大学S-Lab 与普渡大学提出的无分类引导新范式,支持所有Flow-Matching的生成模型,目前已被集成至Diffuse
阅读全文新智元报道 编辑:编辑部 NZY【新智元导读】当下,中国医疗行业正迎来一场硬核突围的历史性转折。面对供应链断裂、技术垄断多重封锁,国产医疗三剑客以技术为剑,以创新为盾,强势打破技术护城河。这将是
阅读全文新智元报道 编辑:KingHZ【新智元导读】刚刚,xAI 正式上线 Grok 3 API,一次性推出4种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic等也
阅读全文新智元报道 编辑:LRST【新智元导读】港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。
阅读全文新智元报道 编辑:桃子 犀牛【新智元导读】谷歌Deep Research重大升级,搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超Open
阅读全文新智元报道 编辑:LRST 好困【新智元导读】北京大学陈宝权教授团队提出RainyGS技术,通过结合物理模拟和3D高斯泼溅渲染框架,实现了真实场景中动态雨效的高质量仿真与呈现,真正实现「从真实到
阅读全文新智元报道 编辑:KingHZ【新智元导读】GPT开山一作、「爱因斯坦级的天才」携手OpenAI前首席研究官,一起加入OpenAI前CTO的新公司Thinking Machine Lab。有消息
阅读全文新智元报道 编辑:编辑部【新智元导读】2025年斯坦福HAI报告重磅发布,456页深度剖析全球AI领域的最新趋势:中美顶级模型性能差距缩至0.3%,以DeepSeek为代表的模型强势崛起,逼近闭
阅读全文新智元报道 编辑:LRST 好困【新智元导读】路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准,通过整合8
阅读全文新智元报道 编辑:英智【新智元导读】AI绘画总「翻车」,不是抓不住重点,就是细节崩坏?别愁!微软和港中文学者带来ImageGen-CoT技术,让AI像人一样思考推理,生成超惊艳画作,性能提升高达
阅读全文新智元报道 编辑:编辑部 NXY【新智元导读】Llama 4本该是AI圈的焦点,却成了大型翻车现场。开源首日,全网实测代码能力崩盘。更让人震惊的是,模型训练测试集被曝作弊,内部员工直接请辞。Me
阅读全文新智元报道 编辑:犀牛【新智元导读】LeCun谢赛宁等研究人员通过新模型Web-SSL验证了SSL在多模态任务中的潜力,证明其在扩展模型和数据规模后,能媲美甚至超越CLIP。这项研究为无语言监督
阅读全文新智元报道 编辑:KingHZ【新智元导读】来自UIUC等大学的华人团队,从LLM的基础机制出发,揭示、预测并减少幻觉!通过实验,研究人员揭示了LLM的知识如何相互影响,总结了幻觉的对数线性定律
阅读全文新智元报道 编辑:编辑部 JNY【新智元导读】原生多模态Llama 4终于问世,开源王座一夜易主!首批共有两款模型Scout和Maverick,前者业界首款支持1000万上下文单H100可跑,后
阅读全文新智元报道 编辑:英智【新智元导读】大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率
阅读全文新智元报道 编辑:英智【新智元导读】最新研究发现,LLM在面对人格测试时,会像人一样「塑造形象」,提升外向性和宜人性得分。AI的讨好倾向,可能导致错误的回复,需要引起警惕。你是否想过,LLM也有
阅读全文新智元报道 编辑:Aeneas 犀牛【新智元导读】刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要
阅读全文新智元报道 编辑:英智 定慧【新智元导读】就在刚刚,Higgsfiled AI推出Motion Controls AI视频生成,在模仿电影级别的动作捕捉删上取得了新进展!不论是是360度环绕拍摄
阅读全文新智元报道 编辑:定慧【新智元导读】在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到
阅读全文新智元报道 编辑:编辑部 ZNH【新智元导读】英特尔与台积电,已经初步达成协议,成立一家合资企业,来运营英特尔的晶圆制造工厂。此后,台积电将持有新公司20%的股份。英特尔的财务危机,要终结了?而
阅读全文新智元报道 编辑:定慧【新智元导读】Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职,她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaC
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】之前靠AI作弊神器横扫大厂offer的小哥,最近有新后续了:创业成功,月入22.85万美元,走上人生巅峰。与此同时,大厂的面试官们可是被
阅读全文新智元报道 编辑:定慧 英智【新智元导读】谷歌DeepMind研发的DreamerV3实现重大突破:无需任何人类数据,通过强化学习与「世界模型」,自主完成《我的世界》中极具挑战的钻石收集任务。该
阅读全文新智元报道 编辑:LRST【新智元导读】通过完全启用并发多块执行,支持任意专家数量(MAX_EXPERT_NUMBER==256),并积极利用共享内存(5kB LDS)和寄存器(52 VGPRs
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】ATEC2025科技精英赛来袭!这是一场由顶尖高校等联手举办的全球科技盛会。21万美金高额奖池,商业级机器人硬件体验,还有与权威学者、产业大咖面对面
阅读全文新智元报道 编辑:桃子 好困【新智元导读】DeepMind内部研究要「封箱」了!为保谷歌在AI竞赛领先优势,生成式AI相关论文设定6个月禁发期。不仅如此,创新成果不发,Gemini短板不提。De
阅读全文