Nature: 精度不受热力学第二定律限制
今天开幕的智源大会主题演讲中,Yoshua Bengio 判断5年内出现人类水平AI;强化学习之父Richard Sutton则预见了AI的体验时代。笔者理解Sutton说的是真实时空的具身体验,需要
阅读全文今天开幕的智源大会主题演讲中,Yoshua Bengio 判断5年内出现人类水平AI;强化学习之父Richard Sutton则预见了AI的体验时代。笔者理解Sutton说的是真实时空的具身体验,需要
阅读全文近期看到一个大模型研究领域有井喷趋势:如何让模型在无需人类过多干预的情况下实现自我提升。自我发展框架让LLM自主生成并优化模型改进算法,通过聚焦模型融合策略,初始模型能通过发现新型融合技术实现迭代升级
阅读全文物理人工智能系统需要感知、理解并在物理世界中执行复杂动作,Nvidia Cosmos-Reason1 【文献1】就是为此而设计。一、Cosmos-Reason1Cosmos-Reason1模型系列宣称
阅读全文作者自述:一位求学者,二十年程序员生涯,游走于工程、语言、知识、智能、数学之间,内心对世界充满诸多好奇与困惑,尝听友人讲大刘《山》的故事,也期自己可凭蛮力,凿空厚壁,得见星空。 引言算术表达式几何 (
阅读全文近日麻省理工学院团队提出了神经热力学定律(NTL,neural thermodynamic laws)【文献1】,笔者这里做个简评。学者们提出LLM损失景观的“河–谷分解法”,引入可解的二阶简化模型,
阅读全文译者注:论文结论跟沿最优输运方向的重整化可能是世界演化的核心方式 中笔者的如下表述一致:“能量在时空中流动,穿越边界的通量变化,派生散度与旋度,即电场和磁场;波放慢速度钝化成粒子(薛定谔的爱情与狄拉克
阅读全文早在2014年,Mehta和Schwab就证明了“基于受限玻尔兹曼机(RBM)的深度模型和变分RG之间存在精确对应”。深度网络底层神经元捕捉细节,高层神经元提取抽象特征,本质上等同于RG中积分掉高频自
阅读全文麻省理工学院研究团队提出了一种以大脑节律为灵感的新型机器学习模型——线性振荡状态空间模型(Linear Oscillatory State-Space Models,简称 LinOSS)【文献1】。它
阅读全文摘要Agentic 应用是利用 AI 智能体驱动功能的程序——这些智能体是为自主收集数据并朝着特定目标采取行动而设计的软件。随着 AI 智能体在现实世界中的应用日益广泛,理解其安全影响变得至关重要。本
阅读全文昨晚笔者总结整理了 d1:通过GRPO在扩散LLM中缩放推理 , 带大家领略了 diffusion + GRPO 威力,也再次印证笔者关于GRPO 是DeepSeek魔法的源泉的判断。无独有偶,另一个
阅读全文加州大学洛杉矶分校与Meta AI的研究团队联合发布了革命性的强化学习框架d1【文献1】。该框架显著提升了基于扩散原理的LLM(dLLM)的推理性能——在某些场景下将响应时间从超过30秒缩短至仅需3秒
阅读全文Spin-Transformer数据雕刻自旋玻璃 中笔者总结过:“从概念上的相似性、物理解释、优化参数规模角度,基于矢量自旋磁化的平均场新方程,提出了一类受物理启发的 spin-transformer
阅读全文笔者近日在朋友圈发了如下感慨:“现在太多科幻叙事下的公司AI战略,看了让人触目惊心,可以判断这些做AI战略的人几乎不看paper的。现在的大模型做个六七十分的demo非常擅长,对企业生产场景却缺乏精准
阅读全文编者注:AI飞速发展的同时,各种新型计算也在不断取得突破,光子、量子、Ising机、热力学计算等,请参考:Ising 机 - Nature 灌水机Nature:薛定谔的猫突破迎来量子计算的圣杯AI 赋
阅读全文传统人工神经网络依赖全局调控的学习模式可能被改写。德国哥廷根大学与马克斯·普朗克动力学与自组织研究所的联合团队,日前在《美国国家科学院院刊》(PNAS)发表研究【文献1】,开发出具有生物神经元特性的"
阅读全文哈佛大学:高维回归中的Scaling Law是重整化的自然结果 从理论角度分析了重整化的物理意义,东京大学物理系学者的文章【文献1】则更接地气、更落地实用。摘要扩散模型基本原理是通过去噪白噪声污染的样
阅读全文《高维回归中的缩放和重整化》【文献1】由哈佛大学物理系、脑科学中心、工程与应用科学学院、自然与人工智能研究所多位学者共同撰写,将随机矩阵理论和自由概率用于理解高维岭回归模型的缩放与重整化行为。一、背景
阅读全文