Nature机器智能:模仿大脑留白,AI学会了说“我不确定”
过度自信是AI模型幻觉的重要来源,Nature机器智能这篇论文,发现一个反直觉的诱因,还找到了修复方法【文献1】。概述不确定性校准,或者说预测置信度与真实准确率对齐,对AI系统可靠部署至关重要,但现代
阅读全文过度自信是AI模型幻觉的重要来源,Nature机器智能这篇论文,发现一个反直觉的诱因,还找到了修复方法【文献1】。概述不确定性校准,或者说预测置信度与真实准确率对齐,对AI系统可靠部署至关重要,但现代
阅读全文如题,笔者注意到近期这个非常深层的产业结构变化。Anthropic与OpenAI开始亲自下场做FDE驻场部署,暗示Agent还远没有可靠到能够完全自主运行企业业务,原因涉及幻觉、一致性、长期激励、上下
阅读全文意识并非独立于物理世界而存在,我们的“灵魂”与我们的身体以及世界上任何其他现象,本质上并无不同。作者简介卡洛·罗韦利是一位著名理论物理学家,以其在量子引力、量子力学基础以及时空本质方面的研究而闻名。洛
阅读全文直接用标准硅MOSFET晶体管构建大规模伊辛机,不用通常的量子退火、光学系统或复杂模拟电路。这是《Science Advances》的论文《完全由硅晶体管组成的可扩展伊辛机》的创新思路【文献1】。背景
阅读全文物理机器学习中,偏微分方程(PDE)约束通常通过自动微分实现,这种机制构成PINN等方法的计算核心。传统PINN隐含采用的是强形式PDE,在每一个点上显式计算导数,并将其代入方程残差。但神经网络本质上
阅读全文OpenAI揭秘GPT怪癖OpenAI发现【文献1】,从GPT5.1开始,模型越来越频繁地在回答中使用goblin(妖精)和gremlin(小妖精),5.1上线后goblin使用量暴涨175%。Ope
阅读全文来自Berkeley,Pennsylvania,Harvard,New York,Stanford大学等多位顶尖学者联合发表综述【文献1】,为深度学习的科学理论做奠基。观点论文开篇提出,一个能刻画神经
阅读全文OpenAI就大模型幻觉问题刚发了Nature【文献1】。论文发现现有的评估方式实际在奖励模型一本正经胡说八道。预训练埋下种子大模型通过学习海量文本来预测下一个词,会产生指向幻觉的统计压力。就是说幻觉
阅读全文千呼万唤 DeepSeek-V4 今天发布!代码、数学超越顶尖闭源模型。“不诱于誉,不恐于诽。率道而行,端然正己”,技术高,德行高,佩服。技术论文也同时发布,传承 V3,不少改进,笔者按照整体架构快速
阅读全文物理学割裂近百年,经典物理描述的宏观世界,与概率支撑起来的微观量子世界,长期井水不犯河水。但麻省理工学院的最新研究【文献1】表明,亚原子粒子的奇异量子行为完全可以通过日常的经典物理概念来理解。最小作用
阅读全文当你在街头看到一只猫时,大脑是如何瞬间认出那是一只猫的?传统理解这个过程是自下而上的,视觉系统先提取边缘、形状和纹理,再逐层整合,最终在高层语义中匹配出猫的概念。自然神经科学评论近日的一篇综述文章《范
阅读全文GenAI 发展似脱缰野马,一日千里,通用智能AGI与超级智能ASI 呼之欲出。失业替代、离职蒸馏的恐怖故事不绝于耳,公众心理因此撕裂,矛盾有激化趋向,灯塔国某AI大厂CEO 甚至家宅被攻击。GenA
阅读全文如何发现未知的量子多体物相,是量子物理与机器学习领域共同的根本挑战。Nature通讯近期一项研究【文献1】,受Kolmogorov复杂度启发,用量子电路复杂度(QCC),为拓扑序构建了一套无监督学习框
阅读全文代码泄漏事件后,Anthropic 变得癫狂,动作频频:先是分享了提升行业认知的情绪研究;随即发布了Claude Mythos Preview,断崖式提升能力,还探索了模型福祉;现在又推出了Agent
阅读全文情绪表征Anthropic在大模型可解释性方面一直做着非常接地气的工作,例如解读“Anthropic大语言模型中的内省迹象”。最近这篇“情绪概念与其在大语言模型中的功能”论文【文献1】研究了大模型是
阅读全文LLM 知识库我最近发现一个非常有用的方法:利用 LLM 为各种感兴趣的研究主题构建个人知识库。这样一来,我近期大部分的 token 消耗,不再主要用于操作代码,而是更多地用于操作知识(以 Mark
阅读全文前天这篇 Nature 论文《通用量表解锁了具有可解释和预测性的人工智能评估》【文献1】,回答了一个关键问题:我们到底在测量什么样的 AI 能力,这些测量是不是能够外推。过去AI的发展进步几乎完全依赖
阅读全文经典复杂系统,通常用节点-边的图结构来描述。节点代表系统中的基本单元,边代表两个节点间的相互作用。这个框架支撑了对互联网、社会系统等复杂结构的理解。但新的研究表明,基于二体相互作用的描述在许多真实系统
阅读全文本周谷歌推出KV Cache 量化压缩技术TurboQuant【文献1】,引发近千亿美元内存股震荡。很快 RaBitQ【文献2】作者高健扬公开发声,指出TurboQuant存在多项学术不端,引发业界
阅读全文UCL这篇论文【文献1】试图回答一个基础问题:在没有奖励、没有监督信号、甚至没有明确任务目标的情况下,大脑如何从连续的体验中提取出稳定可泛化的结构。论文将这一能力界定为统计学习,并提出海马体特别是背侧
阅读全文论文提出了一种能够执行任意非线性计算的热力学计算机设计方案,无需平衡态【文献1】。通过将热力学计算拓展至热平衡态之外,论文实现了类似于经典神经网络的全非线性计算,可在任意指定观测时间内完成运算。核心思
阅读全文在物理学中,临界点是一个介于完全有序与完全无序之间的特殊动力学状态。在这种状态下,系统会表现出尺度不变性,即系统的统计特征在不同空间或时间尺度上呈现出相似的结构。人脑可能就运行在这样的临界点附近,这是
阅读全文Samuel G. B. Johnson1*, Amir-Hossein Karimi2 , Yoshua Bengio3 , Nick Chater4 , Tobias Gerstenberg5 ,
阅读全文