动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025
新智元报道 编辑:LRST【新智元导读】4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用
阅读全文新智元报道 编辑:LRST【新智元导读】4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用
阅读全文新智元报道 编辑:编辑部 JNZ【新智元导读】GPT-4o,登顶王座名副其实!新出炉的图像竞技场中,它以ELO评分并列冠军。而ChatGPT在一小时内,新增用户直接破了百万,全网的病毒式传播还没
阅读全文新智元报道 编辑:桃子【新智元导读】未来十年,全球机器人市场规模将飙升至380亿美金。这一次,孙正义又将目光投向更大的赛道,斥资1万亿豪赌美国AI工业园区,让人形机器人干活。报道称,在「星际之门
阅读全文新智元报道 编辑:编辑部【新智元导读】LLM正推动推荐系统革新,以用户表征为「软提示」的范式开辟了高效推荐新路径。在此趋势下,淘天团队发布了首个基于用户表征的个性化问答基准UQABench,系统
阅读全文新智元报道 编辑:桃子 好困【新智元导读】短短几个月,国产黑马再次拿下新一轮超5亿元融资,引爆具身智能赛道。从「抓糖豆」到「全流程叠衣」技术飞跃,杭州创业沃土孕育的这颗新星,正以软硬全栈技术路线
阅读全文新智元报道 编辑:编辑部 HXs【新智元导读】两家期刊实验表明,250美元报酬,能加快评审速度而不降低质量。但专家警告,现金激励可能悄然改变科研生态,这将为学术评审带来新生,还是埋下隐患?AI在
阅读全文新智元报道 编辑:LRS 好困【新智元导读】SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合
阅读全文新智元报道 编辑:编辑部 NZYH【新智元导读】2025中关村论坛人工智能主题日,高能不断。清华系团队全新Vidu Q1视频生成可控性再创新高,炫目demo惊艳全场。图灵奖得主Joseph Si
阅读全文新智元报道 编辑:KingHZ【新智元导读】给AI一张全新的照片,它能以相当高的准确率还猜出照片在哪个城市拍摄的。在新研究中,表现最好的AI模型,猜出图片所在城市的正确率比人类高62.6%!以后
阅读全文新智元报道 编辑:英智【新智元导读】医学变革风暴来袭!ECgMPL模型如同医学领域的超级侦探,从细胞和组织微观图像里精准揪出癌症踪迹,诊断子宫内膜癌准确率近100%,远超医生平均水平。逆天!新型
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】就在刚刚,2025中关村论坛上智源研究院发布了两大重磅:首个跨本体具身大小脑协作框架RoboOS,以及开源具身大脑RoboBrain!从此,单机
阅读全文新智元报道 编辑:定慧【新智元导读】AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发
阅读全文新智元报道 编辑:LRS【新智元导读】史上最大的基因组AI模型Evo 2使用超过12.8万个基因组数据训练,包含9.3万亿个核苷酸,能预测突变效应、设计 DNA 序列,并通过可视化工具展示学习到
阅读全文新智元报道 编辑:Aeneas 桃子【新智元导读】刚刚,出门问问2024年报正式发布!过去一年,集团AIGC纯软件产品收入突破2.2亿元,同比增长88.5%,高毛利驱动总收入达3.9亿元。这家「
阅读全文新智元报道 编辑:LRST【新智元导读】「思维链劫持」(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模
阅读全文新智元报道 编辑:LRST【新智元导读】Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】巨头英伟达,即将收购阿里前副总裁贾扬清的初创Lepton AI,交易价值或达数亿美元!而Lepton AI,仅仅创立两年。就在刚刚,国内AI圈被这一
阅读全文新智元报道 编辑:KingHZ 犀牛【新智元导读】前英特尔CEO、科技行业大佬帕特·基辛格(Pat Gelsinger)再次出山,加入风投企业Playground Global,重点投入硬科技,
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】近日,一则重磅消息引爆业内——vivo官宣成立机器人Lab,正式进军机器人行业!不是赶热点,不是盲目下场,30年积累,或让这枚「巨无霸」的入局在业内
阅读全文新智元报道 编辑:编辑部 HNZY【新智元导读】AI音乐,从此进入「会思考」的时代!刚刚,昆仑万维扔出一枚重磅炸弹——全球首款音乐推理大模型Mureka O1横空出世,实力碾压Suno,强势登顶
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】AI如何重塑孩子的未来?听力熊Teeni.AI首席科学家张驰携自进化智能体AppAgentX重磅亮相,要把AI打造成孩子成长路上的「最佳拍档」。这不
阅读全文新智元报道 编辑:LRST【新智元导读】OpenGS-SLAM是一种新的RGB-only SLAM系统,专门用于无界户外场景。它通过点图回归网络和3D高斯分布(3DGS)表示,实现了精准的相机定
阅读全文新智元报道 编辑:编辑部【新智元导读】685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大
阅读全文新智元报道 编辑:LRS【新智元导读】块离散去噪扩散语言模型(BD3-LMs)结合自回归模型和扩散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长
阅读全文新智元报道 编辑:英智【新智元导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonn
阅读全文新智元报道 编辑:桃子 好困【新智元导读】氛围编程彻底火了。刚刚,没有任何Swift编程经验的Karpathy亲自代言,通过与ChatGPT多轮对话,仅用400行代码构建出自己的首个iOS应用。
阅读全文新智元报道 编辑:犀牛【新智元导读】随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。A
阅读全文新智元报道 编辑:LRST【新智元导读】视觉+语音=更强的语音识别!BPO-AVASR通过优化音视频输入和输出偏好,提升语音识别在真实场景中的准确性,解决了传统方法在噪声、口语化和视觉信息利用不
阅读全文新智元报道 编辑:JNY【新智元导读】最新一期TED采访中,奥特曼重申对OpenAI率先发布AGI的信念,并称没有多少人会关心。全程45分钟,他还重点分享了自己对AI未来的独特看法。奥特曼再谈A
阅读全文新智元报道 编辑:KingHZ【新智元导读】Epoch AI高级研究员预测:2030年实现人类水平的AI的可能性至少10%。他认为AI从监督学习到GenAI,模型范式转变迅捷,预测AI只能从第一
阅读全文