10个视频9个看走眼:连真视频都打Sora水印碰瓷,这世界还能信啥?
机器之心报道编辑:杨文AI 检测准确率高达 98.9%,也防不住有人给真视频 P 上 Sora 水印。前段时间刷到一个视频,标题就是「中俄混血女明星回应地下室打婆婆传闻」,试问谁看了这个标题能不燃起熊
阅读全文机器之心报道编辑:杨文AI 检测准确率高达 98.9%,也防不住有人给真视频 P 上 Sora 水印。前段时间刷到一个视频,标题就是「中俄混血女明星回应地下室打婆婆传闻」,试问谁看了这个标题能不燃起熊
阅读全文长期以来,扩散模型的训练通常依赖由变分自编码器(VAE)构建的低维潜空间表示。然而,VAE 的潜空间表征能力有限,难以有效支撑感知理解等核心视觉任务,同时「VAE + Diffusion」的范式在训练
阅读全文随着 AI 能力不断增强,它正日益融入我们的工作与生活。我们也更愿意给予它更多「授权」,让它主动去搜集信息、分析证据、做出判断。搜索智能体正是 AI 触达人类世界迈出的重要一步。然而,现实世界的
阅读全文机器之心原创作者:吴昕这个双十一,终于可以把人形机器人放入购物车了。9998元、21个自由度双十一的购物车又满了?手机、平板、耳机、手表、化妆品、衣服……今年,还有一件「意想不到」的商品悄悄加入——不
阅读全文机器之心报道编辑:Panda强化学习能力强大,几乎已经成为推理模型训练流程中的标配,也有不少研究者在探索强化学习可以为大模型带来哪些涌现行为。现在,问题来了:要让大模型学会推理,强化学习是必需的吗?近
阅读全文年初的 DeepSeek-R1,带来了大模型强化学习(RL)的火爆。无论是数学推理、工具调用,还是多智能体协作,GRPO(Group Relative Policy Optimization)都成了最
阅读全文陆毅,复旦大学自然语言处理实验室硕士生,在 ACL、EMNLP、COLM、NeurIPS 等顶会发表论文十余篇,LongCat Team 核心成员,研究方向为大模型的复杂推理和长序列建模,指导老师为桂
阅读全文机器之心报道编辑:泽南、Panda「我很喜欢新的 DeepSeek-OCR 论文…… 也许更合理的是,LLM 的所有输入都应该是图像。即使碰巧有纯文本输入,你更应该先渲染它,然后再输入。」一夜之间,大
阅读全文机器之心报道编辑:杨文、+0天天刷推,大模型的脑子也会坏掉。终于有研究证明,互联网上的烂内容会让大模型得「脑腐」。相信许多读者对「脑腐」这个词并不陌生,长时间沉浸在碎片化的网络信息中,我们经常会感到注
阅读全文本研究由西湖大学 ENCODE Lab 牵头,联合同济大学、浙江大学和新加坡国立大学共同完成。团队在大模型强化学习与多模态推理方向具有深厚研究基础。近年来,大语言模型(LLMs)以及多模态大模型(ML
阅读全文在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。比如,在医疗领域,研究人员往往会用领域专属数据对大模型进行微调,从而显著提升模型在该领域特定任务上的
阅读全文机器之心报道编辑:Panda最近,一则趣闻在社交媒体上流传:当诺贝尔奖委员会还在费力寻找新晋生理学或医学奖得主时,一位小红书网友似乎早已在美国落基山脉与他偶遇并聊了天。这件「让世界先一步找到你」的轶事
阅读全文机器之心报道编辑:PandaRich Sutton 曾说过:「AI 只能在可以自我验证的范围内创造和维持知识。」爱因斯坦与英费尔德在合著的《物理学的进化》中也写道:「提出一个问题往往比解决问题更重要,
阅读全文本文的主要作者来自香港大学、VAST、哈尔滨工业大学及浙江大学。本文的第一作者为香港大学博士生杨运涵。本文的通讯作者为香港大学刘希慧教授与VAST 公司首席科学家曹炎培博士。在3D内容创作领域,如何像
阅读全文尽管视觉语言模型(LVLMs)在图像与短视频理解中已取得显著进展,但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一
阅读全文机器之心报道编辑:张倩在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale?sc
阅读全文机器之心报道机器之心编辑部在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。向量数据库 Chroma 创始人兼
阅读全文本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。在机器人学习领域,提升基于生成式模型
阅读全文机器之心报道机器之心编辑部10 月 18 日,据新华社消息称,享誉世界的物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研究院名誉院长杨振宁先生,因病在北京逝世,享年 103
阅读全文机器之心报道编辑:Panda、泽南给 AGI 画一条「及格线」,GPT-4 和 GPT-5 竟都是「差等生」?通用人工智能(Artificial General Intelligence,AGI)是目
阅读全文机器之心报道编辑:冷猫、+0打造科研界的 AlphaGo。今天,理论物理学家、物理学新视野奖获得者 Alex Lupsasca 有了一个新身份:OpenAI for Science 团队的首位学术研究
阅读全文近年来,多模态大语言模型(MLLMs)取得了令人瞩目的突破,在视觉理解、跨模态推理、图像描述等任务上表现出强大的能力。然而,随着这些模型的广泛部署,其潜在的安全风险也逐渐引起关注。研究表明,MLLMs
阅读全文本文的第一作者雷京迪是南洋理工大学博士生,其研究聚焦于大语言模型,尤其关注模型推理、后训练与对齐等方向。通讯作者 Soujanya Poria 为南洋理工大学电气与电子工程学院副教授。论文的其他合作者
阅读全文机器之心发布机器之心编辑部国内首个少样本通用具身操作基础模型发布,跨越视觉语言与机器人操作的鸿沟。具身智能领域终于要突破 “数据桎梏” 了吗?相较于自然语言、视觉领域,具身智能的数据天然稀缺。真实世界
阅读全文机器之心报道机器之心编辑部距离上次新品发布仅仅两周后,Anthropic 又出手了。最新消息,Anthropic 发布轻量级模型 Claude Haiku 4.5,主打「更便宜、更快速」。据 Anth
阅读全文机器之心报道编辑:Panda今天,谷歌有点忙。一方面,他们与耶鲁大学合作基于 Gemma 研发的 Cell2Sentence-Scale 27B (C2S-Scale) 首次预测了一种新的潜在癌症疗法
阅读全文如何让 AI 像人类一样从对世界的观察和互动中自然地学会理解世界?在今年的国际计算机视觉大会(ICCV 2025)上,来自浙江大学、香港中文大学、上海交通大学和上海人工智能实验室的研究人员联合提出了第
阅读全文机器之心报道编辑:杜伟算力紧缺长期困扰学术界,而腾讯青云奖学金的设立,为青年学者提供了有力支持,帮助他们将更多精力投入到真正有价值、有意义的科研探索。如果你要问:在当下的 AI 时代,高校科研群体面临
阅读全文机器之心报道编辑:冷猫先给各位读者看个视频:Prompt : Design and create a web os like mac os full functional features from
阅读全文无论是中文的粤语、闽南话、吴语,还是欧洲的荷兰比尔茨语方言、法国奥克语,亦或是非洲和南美的地方语言,方言都承载着独特的音系与文化记忆,是人类语言多样性的重要组成部分。然而,许多方言正在快速消失,语音技
阅读全文