普林斯顿、剑桥、MSRA学者 Nature 发文:当前 AI 评测打榜刷 SOTA 不科学,需要一种可解释、可预测的新范式
前天这篇 Nature 论文《通用量表解锁了具有可解释和预测性的人工智能评估》【文献1】,回答了一个关键问题:我们到底在测量什么样的 AI 能力,这些测量是不是能够外推。过去AI的发展进步几乎完全依赖
阅读全文前天这篇 Nature 论文《通用量表解锁了具有可解释和预测性的人工智能评估》【文献1】,回答了一个关键问题:我们到底在测量什么样的 AI 能力,这些测量是不是能够外推。过去AI的发展进步几乎完全依赖
阅读全文经典复杂系统,通常用节点-边的图结构来描述。节点代表系统中的基本单元,边代表两个节点间的相互作用。这个框架支撑了对互联网、社会系统等复杂结构的理解。但新的研究表明,基于二体相互作用的描述在许多真实系统
阅读全文本周谷歌推出KV Cache 量化压缩技术TurboQuant【文献1】,引发近千亿美元内存股震荡。很快 RaBitQ【文献2】作者高健扬公开发声,指出TurboQuant存在多项学术不端,引发业界
阅读全文UCL这篇论文【文献1】试图回答一个基础问题:在没有奖励、没有监督信号、甚至没有明确任务目标的情况下,大脑如何从连续的体验中提取出稳定可泛化的结构。论文将这一能力界定为统计学习,并提出海马体特别是背侧
阅读全文论文提出了一种能够执行任意非线性计算的热力学计算机设计方案,无需平衡态【文献1】。通过将热力学计算拓展至热平衡态之外,论文实现了类似于经典神经网络的全非线性计算,可在任意指定观测时间内完成运算。核心思
阅读全文在物理学中,临界点是一个介于完全有序与完全无序之间的特殊动力学状态。在这种状态下,系统会表现出尺度不变性,即系统的统计特征在不同空间或时间尺度上呈现出相似的结构。人脑可能就运行在这样的临界点附近,这是
阅读全文Samuel G. B. Johnson1*, Amir-Hossein Karimi2 , Yoshua Bengio3 , Nick Chater4 , Tobias Gerstenberg5 ,
阅读全文今年春晚人形机器人大放异彩,但其泛化能力也持续受到质疑,宇树创始人王兴兴本人也承认这一点。如何建模复杂动力系统,让机器人既有表现力,又严格遵守物理定律,一直是困扰整个行业的关键难题。传统数值模拟方法精
阅读全文大家都知道,自然语言处理、时间序列预测、语音识别和控制等领域的序列建模任务,需要学习从输入序列到输出序列的复杂映射关系。在循环网络(RNN)中,理论上需要非线性循环才能普适性地逼近这类序列到序列的函数
阅读全文丙午马年初一苦等DeepSeek V4 未果,索性整理点近期看到的有趣研究和观点,不做老登说教,读者自己取其精华去其糟粕。一、酒还是少喝点标题:急性酒精摄入导致的神经活动转变:从灵活的全局集成网络到分
阅读全文凌晨三点多醒来,思如泉涌,猛然想明白了 Seedance 2.0 的智能原理,兴奋的睡不着,遂起来码字。昨日字节正式发布Seedance 2.0,其中一句话给了笔者重要启发:“依靠海量世界知识、稀疏架
阅读全文今日严寒,适合居家码字。简单讲讲最近持续火爆的 Clawdbot / Moltbot / OpenClaw吧,命名是 IT 项目难度最大部分。本质首先 OpenClaw 是个大模型Agent,如果还没
阅读全文“上帝给了坚果,但没把它们敲开” -- 卡夫卡。大模型就是这样的坚果,智能体系统也是,敲开祂们让人着迷。近日笔者考古,发掘出半年前一篇发表在《机器学习研究杂志》(JMLR)上的小众宝藏论文《用于无限维
阅读全文译者注:OpenAI 内部 “数据智能体” 实践,非常值得参考,看看如何规避智能体内在局限的同时,发挥其最大的价值。作者:Bonnie Xu, Aravind Suresh, Emma Tang数据驱
阅读全文“人工智能血战前行的历史恰如煤的形成,当时用大量的木材,结果只是一小块,而压缩是不在其中的,更何况是无损”。 -- 鲁迅2026年伊始,就有卡内基梅隆学者倒反天罡,抛出惊世骇俗的理论【文献1】,文中
阅读全文本文是笔者在公司部门年会上给同事们分享的,个人关于“未来如何与AI相处”的观点,脱敏分享出来,跟读者共勉。AI的问题,本质还是人的问题当下关于 AI 的讨论,往往陷入两个极端:一个是技术乐观主义,认为
阅读全文近年来,大语言模型崛起,引发激烈的讨论,AI的创造力是否正在逼近甚至超越人类?我们如何系统、客观地比较AI与人类的创造力,尤其是衡量那种天马行空、联想丰富的发散性思维?Yoshua Bengio团队昨
阅读全文昨日一项发表在 Nature 上的重磅研究【文献1】为生成式 AI 的安全再次敲响警钟。论文发现,在一个极窄的特定任务中诱导模型产生不良行为,会导致模型在完全无关的任务中也出现整体性的价值观崩坏。黑化
阅读全文译者注:来自《新科学家》杂志 - 网站与杂志提供专家记者的科学新闻与深度长文,涵盖科学、技术、健康及环境领域的发展。数个世纪以来,对称性原理指引着物理学家追寻更根本的真理,但如今一系列惊人的发现表明,
阅读全文DeepSeek 昨晚发布 Engram 新论文,通过静态查询为大模型提供条件记忆。Engram 简化了 MoE 的冗余计算,介绍文章很多,笔者这里谈谈它对企业级 AI 核心技术栈的潜在影响,涉及 R
阅读全文题目:一种多面体结构控制了可编程自组装 期刊:Nature Physics(2026 年 1 月 8 日)链接:https://www.nature.com/articles/s41567-025-0
阅读全文笔者昨晚突然想到 “融合DeepSeek OCR + mHC” 这个主题,兴奋的睡不着,连夜梳理。站在2026年初,回头看DeepSeek这两项看似孤立却内在契合的技术, 笔者隐约察觉到 DeepSe
阅读全文长期以来,阿尔茨海默症(Alzheimer’s disease,AD)被当作一种“不可逆”的神经退行性疾病。一旦进入中晚期,认知衰退似乎就只剩下一个方向。但最近一项发表在Cell Reports Me
阅读全文华人学者闪耀2026元旦,前有DeepSeek mHC:一次将 Transformer 残差流拉回重整化轨道的重大升级,后有清华的“算盘:可扩展光子线性向量机”【文献1】与中科院大学的“可编程光子Is
阅读全文DeepSeek 不会浪费每一个公共假期,昨天的预感还是来了:梁同学亲自上传【文献1】,提出 mHC(Manifold-Constrained Hyper-Connections),流形约束超连接。通
阅读全文过去一年,Agentic AI几乎成了所有大模型应用的默认叙事,自动写代码、自动做研究、自动操作软硬件。昨晚Meta官宣数十亿美元收购Manus以扩展其AI Agent能力,年末将这波Agent热潮推
阅读全文