AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT
IneqMath团队 投稿量子位 | 公众号 QbitAI这不是段子,而是正在发生的现象。大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。斯坦福
阅读全文IneqMath团队 投稿量子位 | 公众号 QbitAI这不是段子,而是正在发生的现象。大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。斯坦福
阅读全文GUIRoboTron-Speech团队 投稿量子位 | 公众号 QbitAI只需要动动嘴就可以驱动GUI代理?由美团和浙江大学联合推出的GUIRoboTron-Speech——让用户解放双手,直接对
阅读全文衡宇 发自 凹非寺量子位 | 公众号 QbitAIHow time flies!又到了一年一度的618。今年你下单了吗?抢到心仪的商品了吗?快递收得顺利不?血拼了大半个月的我有一个最大的体会,就是今年
阅读全文西风 发自 凹非寺量子位 | 公众号 QbitAI罗永浩,干不过罗永浩???今年618大促,罗永浩数字人百度电商直播上岗,“一不小心”就创造了个纪录——带货单量超5月罗永浩真人百度电商直播首秀同期数据
阅读全文LinGn团队 投稿量子位 | 公众号 QbitAI视频生成模型太贵太慢怎么办?普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂
阅读全文SeqPO-SiMT团队 投稿量子位 | 公众号 QbitAIAI字幕总是慢半拍,质量和延迟难以平衡是业界老问题了。为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译
阅读全文白交 发自 凹非寺量子位 | 公众号 QbitAICVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。比如随手抓住一只何恺明,直接变成追星现场。在以谷歌/Meta等国际巨头为主导的展区里,
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI编程王者Claude地位不稳了??大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。要知道Claud
阅读全文GRA团队 投稿量子位 | 公众号 QbitAI无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升?上海人工智能实验室联合中国人民大学提出的GRA框架(Generator–Reviewer–Ad
阅读全文MathFusion团队 投稿量子位 | 公众号 QbitAI当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。为了打破
阅读全文GUI-Critic-R1团队 投稿量子位 | 公众号 QbitAIGUI智能体总是出错, 甚至是不可逆的错误。即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在
阅读全文贾浩楠 发自 凹非寺量子位 | 公众号 QbitAICVPR 2025,自动驾驶传来重大进展:Scaling Law,首次在这条赛道被验证!来自中国的小鹏汽车,完整拿出了技术方案和AI司机“智能涌现”
阅读全文克雷西 发自 凹非寺量子位 | 公众号 QbitAI推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了be
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAI「西部世界」真的要来了!科学家们正试图为AI装上人类大脑。最新进展由美国国家实验室主导。科学家们正在试图将科幻拉进现实:打造一台占地仅两平方米、神经元
阅读全文R-KV团队 投稿量子位 | 公众号 QbitAI推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,
阅读全文腾讯AI Lab 投稿量子位 | 公众号 QbitAI让网页智能体自演进突破性能天花板!腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真
阅读全文一水 鹭羽 发自 凹非寺量子位 | 公众号 QbitAI圈粉无数的Arc浏览器,在AI加持下华丽丽“变身”了——还是同一家公司出品,首个AI原生浏览器Dia正式启动内测,最大亮点是无需打开ChatGP
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI用意念操控万物的“脑机接口”,就这样离我们更近了?!据央妈最新报道,我国已成功开展首例侵入式脑机接口临床试验——一位因意外事故导致四肢截肢的男子,现在
阅读全文衡宇 发自 凹非寺量子位 | 公众号 QbitAI短视频平台熬夜冲浪的我突然发现,AI ASMR突然火了?!大家可以打开声音欣赏一下这条切割浆果的视频,它拿下了16500000的浏览量。这条视频来自洋
阅读全文Griffin团队 投稿量子位 | 公众号 QbitAI在企业系统和科学研究中普遍存在、结构复杂的关系型数据库(Relational DataBase, RDB)场景中,基础模型的探索仍处于早期阶段。
阅读全文白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI苹果放鸽子的更新,国产AI率先实现了。背上一个看起来平平无奇、体积也没什么存在感的包,宇树机器人就声情并茂地开口说话。社交i人戴上AI眼镜,就可
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAI好家伙,机器人进厂打工原视频流出,整整60分钟,完全未剪辑。前几天Figure 02晒1分钟物流分拣视频,网友们完全没看够啊。于是Figure创始人立
阅读全文SafeKey团队 投稿量子位 | 公众号 QbitAI大型推理模型(LRMs)在解决复杂任务时展现出的强大能力令人惊叹,但其背后隐藏的安全风险不容忽视。尽管学术界已尝试通过监督微调(SFT)有效地提
阅读全文KRIS-Bench团队 投稿量子位 | 公众号 QbitAI人类在学习新知识时,总是遵循从“记忆事实”到“理解概念”再到“掌握技能”的认知路径。AI是否也建立了“先记住单词,再理解原理,最后练习应用
阅读全文Scene Splatter团队 投稿量子位 | 公众号 QbitAI三维场景是构建世界模型、具身智能等前沿科技的关键环节之一。尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等生成
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI没有一个大模型可以一统天下。这,或许已经成为了AI大模型时代行业里的一个共识。在如此背景之下,面对众多且日新月异的主流大模型和AI技术,如何能在一个框
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAI物理学正在走向人工智能——Meta开源发布V-JEPA 2世界模型:一个能像人类一样理解物理世界的AI模型。图灵奖得主、Meta首席AI科学家Yann
阅读全文Planing Lab团队 投稿量子位 | 公众号 QbitAIGraphRAG的索引速度慢,LightRAG的查询延迟高?这些影响效率的难题,现在终于迎来改进——由华东师范大学李翔老师带领的的Pla
阅读全文中兴通讯AIM团队 投稿量子位 | 公众号 QbitAI如何让AI代码补全更懂开发者?中兴通讯团队提出了两个新的评测指标,以及一套仓库级代码语料处理框架。按照团队的说法,这套方法论不仅为评测代码大模型
阅读全文Video-Bench团队 投稿量子位 | 公众号 QbitAI视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式,从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模
阅读全文