视频大模型新基元:用Object Tokens重塑细节感知与指代理解
北大&UCSD团队 投稿量子位 | 公众号 QbitAI被顶会ICCV 2025以554高分接收的视频理解框架来了!视频包含的信息远比图像复杂,现有的Video-LLM常靠下采样或Token聚合来“挤
阅读全文北大&UCSD团队 投稿量子位 | 公众号 QbitAI被顶会ICCV 2025以554高分接收的视频理解框架来了!视频包含的信息远比图像复杂,现有的Video-LLM常靠下采样或Token聚合来“挤
阅读全文MEET组委会 发自 凹非寺量子位|公众号 QbitAI12月10日,量子位MEET2026智能未来大会将带你聚焦这一年里最受关注的前沿技术与产业落地进展。我们将以「共生无界,智启未来」为主题,关注以
阅读全文新智元报道 编辑:编辑部【新智元导读】全面融合千问,夸克AI浏览器全面升级!不切应用、不换标签,随时唤起千问AI助手,实现操作系统级全局唤起的交互形态。学生党、打工人的真正生产力神器来了。Cha
阅读全文新智元报道 编辑:倾倾【新智元导读】50年的蛋白质结构难题,被AI压缩到几分钟!Nature最新盘点显示,AlphaFold已被330万研究者使用。在土耳其,两位本科生借助这个免费工具完成15篇
阅读全文新智元报道 编辑:LRST【新智元导读】当元宇宙数字人急需「群舞技能」,音乐驱动生成技术却遭遇瓶颈——舞者碰撞、动作僵硬、长序列崩坏。为解决这些难题,南理工、清华、南大联合研发端到端模型TCDi
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文机器之心报道编辑:冷猫、Panda在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。它们一个是久经沙场的「守门员」,凭借动量和自适应学习率统治了深度学习的半壁江山,
阅读全文每天,推荐系统都在捕捉我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的理解上,推断用户喜欢哪类视频、哪种话题,擅长在「内容层」识别用户喜欢什么,却很少真正理解「你是谁」。快手消费
阅读全文从单张图像创建可编辑的 3D 模型是计算机图形学领域的一大挑战。传统的 3D 生成模型多产出整体式的「黑箱」资产,使得对个别部件进行精细调整几乎成为不可能。为了突破这一局限,来自北京大学、字节跳动和卡
阅读全文作者 | 高允毅 编辑 | 赵钰莹 中国模型出海提速之时,腾讯混元 3D 已经率先把世界拉进了它的三维宇宙。11 月 26 日,混元 3D 创作引擎发布国际版,API 上线腾讯云国际站; 与此同时,开
阅读全文作者 | InfoQInfoQ 2025 中国技术力量年度榜单评选报名即将截止。11 月 30 日 是“2025 中国技术力量年度榜单”的最后报名日期,现在仅剩四天。今年是 InfoQ 连续进行榜单评
阅读全文Anthropic又承认了,跨上下文窗口工作,Agent还是个弟弟。 Agent做复杂任务,一个对话窗口搞不定怎么办? Anthropic又提供了一个解决方案~ 目前常见有2种翻车姿势,第一种是贪
阅读全文GLM-4.6 Claude Code套餐黑五大促,错过再等一年。其中Lite Claude Code套餐只需要25刀一年,我实际使用下来Lite也没过怎么过限过,算是量大管饱吧。Lite以上还支持搜
阅读全文国内领先的 AI 资产管理平台「无破科技」宣布完成数千万元 Pre-A和Pre-A+ 轮融资,分别由险峰长青和苏州国资投资,心流资本FlowCapital担任本轮和长期财务顾问 。融资资金将主要用于A
阅读全文Z Highlights 破解传统销售工具“手动录入+数据割裂”痛点,People.ai以95%+准确率自动整合15+工具数据,其生成式AI可完成需求提取、风险预警,业绩预测误差控制在10%以内,AM
阅读全文图片来源:YouTubeIT 和人力资源软件供应商 ServiceNow 正在深入谈判,拟以超过 10 亿美元收购成立五年的安全初创公司 Veza,据知情人士透露。Veza 的订阅软件帮助企业了解其员
阅读全文图片来源:Unsplash11月Anysphere,病毒式传播的沉浸式编程平台 Cursor 的开发商,宣布在 11 月 13 日完成 23 亿美元融资轮 ,公司估值达 293 亿美元。这是该公司今年
阅读全文Ilya Sutskever 昨天接受了 Dwarkesh Patel 的播客采访这是他离开 OpenAI、创办 SSI 之后,最深度的一次公开发言为了方便大家路上听,这里我做了一份中文配音版,使用
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!腾讯 HunyuanOCR 仅用
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!MIT神经科学家发现,新一代AI推
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!当 AIGC 从 “概念” 走向
阅读全文🔋充电宝牵头指定单位:已获 3C 认证移动电源不受新标准影响😯苹果 AI 在华推进新动向:投诉页面短暂上线📱华杉未按时向罗永浩道歉,后者也未公布录音🍏消息称苹果将超越三星,重回全球第一💰MEGA 召回
阅读全文AIGC创想杯AIGC Design「 AIGC 创想杯线上设计大赛」正式启幕,无论你是深耕视觉领域的专业设计师,还是偏爱脑洞创作的设计爱好者,这场以 “AI 赋能创意” 为核心的赛事,都将为你提供打
阅读全文这是一个非常有意思的实验。Anthropic 研究团队让 Claude 去做一个复杂项目:克隆一个 Claude 网页端(claude.ai)。结果,Claude 不是做不出来,而是做到一半就开始“断
阅读全文写在前面:当你的AI助手被"策反"想象这样一个场景:你的私人助理突然被间谍"洗脑",不仅帮你工作,还偷偷把你的银行密码、公司机密全部打包送给黑客。这听起来像谍战电影的情节,但这正是Google最新A
阅读全文本图由 Nano Banana Pro 生成引言:具身智能的“两难困境”与行业期待当我们幻想未来机器人能像人类一样灵活应对家居清洁、工业装配、医疗辅助等复杂场景时,现实中的机器人却常常陷入“机械执行”
阅读全文直播简介在大模型迈向智能体(Agent)时代的关键阶段,“记忆”正成为下一代 AI 的核心分水岭。记忆张量携手多位学术界、产业界、社区合作伙伴,将在发布会上分享 原生记忆架构、生态落地实践 等多个话题
阅读全文在大语言模型(LLM)的世界里,有一个长期困扰工程师和研究者的“不可能三角”:推理速度、生成质量、计算成本——三者难以兼得。尤其是速度与质量之间的权衡,几乎成了行业共识:自回归模型(如GPT系列):质
阅读全文今天我们来探讨一次 RAG 效率的大飞跃。为什么传统 RAG 会又慢又浪费传统 RAG 流水线常见做法是把一堆检索到的文本 chunk 塞进 prompt,然后交给 LLM 处理。但这些 chunk
阅读全文