今日严寒,适合居家码字。简单讲讲最近持续火爆的 Clawdbot / Moltbot / OpenClaw吧,命名是 IT 项目难度最大部分。本质首先 OpenClaw 是个大模型Agent,如果还没
阅读全文“上帝给了坚果,但没把它们敲开” -- 卡夫卡。大模型就是这样的坚果,智能体系统也是,敲开祂们让人着迷。近日笔者考古,发掘出半年前一篇发表在《机器学习研究杂志》(JMLR)上的小众宝藏论文《用于无限维
阅读全文译者注:OpenAI 内部 “数据智能体” 实践,非常值得参考,看看如何规避智能体内在局限的同时,发挥其最大的价值。作者:Bonnie Xu, Aravind Suresh, Emma Tang数据驱
阅读全文“人工智能血战前行的历史恰如煤的形成,当时用大量的木材,结果只是一小块,而压缩是不在其中的,更何况是无损”。 -- 鲁迅2026年伊始,就有卡内基梅隆学者倒反天罡,抛出惊世骇俗的理论【文献1】,文中
阅读全文本文是笔者在公司部门年会上给同事们分享的,个人关于“未来如何与AI相处”的观点,脱敏分享出来,跟读者共勉。AI的问题,本质还是人的问题当下关于 AI 的讨论,往往陷入两个极端:一个是技术乐观主义,认为
阅读全文近年来,大语言模型崛起,引发激烈的讨论,AI的创造力是否正在逼近甚至超越人类?我们如何系统、客观地比较AI与人类的创造力,尤其是衡量那种天马行空、联想丰富的发散性思维?Yoshua Bengio团队昨
阅读全文昨日一项发表在 Nature 上的重磅研究【文献1】为生成式 AI 的安全再次敲响警钟。论文发现,在一个极窄的特定任务中诱导模型产生不良行为,会导致模型在完全无关的任务中也出现整体性的价值观崩坏。黑化
阅读全文译者注:来自《新科学家》杂志 - 网站与杂志提供专家记者的科学新闻与深度长文,涵盖科学、技术、健康及环境领域的发展。数个世纪以来,对称性原理指引着物理学家追寻更根本的真理,但如今一系列惊人的发现表明,
阅读全文DeepSeek 昨晚发布 Engram 新论文,通过静态查询为大模型提供条件记忆。Engram 简化了 MoE 的冗余计算,介绍文章很多,笔者这里谈谈它对企业级 AI 核心技术栈的潜在影响,涉及 R
阅读全文题目:一种多面体结构控制了可编程自组装 期刊:Nature Physics(2026 年 1 月 8 日)链接:https://www.nature.com/articles/s41567-025-0
阅读全文笔者昨晚突然想到 “融合DeepSeek OCR + mHC” 这个主题,兴奋的睡不着,连夜梳理。站在2026年初,回头看DeepSeek这两项看似孤立却内在契合的技术, 笔者隐约察觉到 DeepSe
阅读全文长期以来,阿尔茨海默症(Alzheimer’s disease,AD)被当作一种“不可逆”的神经退行性疾病。一旦进入中晚期,认知衰退似乎就只剩下一个方向。但最近一项发表在Cell Reports Me
阅读全文华人学者闪耀2026元旦,前有DeepSeek mHC:一次将 Transformer 残差流拉回重整化轨道的重大升级,后有清华的“算盘:可扩展光子线性向量机”【文献1】与中科院大学的“可编程光子Is
阅读全文DeepSeek 不会浪费每一个公共假期,昨天的预感还是来了:梁同学亲自上传【文献1】,提出 mHC(Manifold-Constrained Hyper-Connections),流形约束超连接。通
阅读全文过去一年,Agentic AI几乎成了所有大模型应用的默认叙事,自动写代码、自动做研究、自动操作软硬件。昨晚Meta官宣数十亿美元收购Manus以扩展其AI Agent能力,年末将这波Agent热潮推
阅读全文随着LLM与多模态大模型发展,AI4S也出现多种科学基础模型,用于如分子性质、材料行为、蛋白质结构等的研究。MIT学者近期发表了他们对这些科学基础模型内部“如何表征现实世界的物质”做的非常富有启发性的
阅读全文AI已经能写代码、做奥数、生成音视频,然而却还是不懂真正的三维世界。康奈尔大学的论文《Knot So Simple》【文献1】提出KnotGym,揭示了目前AI的这一致命短板。KNOTGYM 是一个视
阅读全文摘要Salesforce在实际业务应用中发现可靠性问题后,正重新审视其对大模型生成式AI的依赖。【译者注:跟笔者预判一致 AI Agent不该是这个样子,还远没有达到企业核心场景需要的准确、可靠、一致
阅读全文近来 Palantir 在资本市场与技术传播中,被描述为一种近乎神奇的力量:只要把数据灌进去,其完善的本体(Ontology)结构,就能自动支撑最优决策。但如果从动态认知结构的角度审视 Palanti
阅读全文希伯来大学、谷歌研究院、普林斯顿大学、加州大学洛杉矶分校、纽约大学、哈佛大学等机构的学者在自然通讯联合发文【文献1】。发现:人类大脑处理语言的时间顺序,与大语言模型的层级结构惊人匹配!大脑处理自然语言
阅读全文最近一篇发表在 《人类神经科学前沿》 的论文提出了一种非常新颖的意识理论【文献1】,试图将量子物理与意识状态联系起来,为意识的本质提供一种全新的视角。一、意识不仅是神经元互动传统神经科学一般认为,意识
阅读全文美是什么?为什么有些画面让人一眼就觉得舒服、高级、美? 新发表在PNAS Nexus上的研究《少即是美:审美偏好与视觉系统代谢消耗呈负相关》【文献1】给出了一个有趣的答案:美感与大脑的能量消耗呈反比。
阅读全文持续重整化范畴论、GRPO与CoT三位一体中笔者完善了大模型数理认知框架如下:一句话总结就是:重整化提取出范畴,持续重整化驱动范畴相变,然后逆重整化推理。这里的持续重整化,还局限在预训练阶段,语料分批
阅读全文近几天,多篇国外科技媒体报道将“AI意识”再次推上风口。Futurism与LiveScience都冠以惊悚风格标题:“关闭AI的撒谎能力后,它更容易声称自己有意识,这太诡异。”这源自【文献1】的研究发
阅读全文对比阅读DeepSeekMath-V2与V1的论文,笔者感觉V2是一次范式迁移,从追求“答案正确”转向“过程正确”。预处理自然语言表述的数学问题作为输入,将问题拆成“证明目标+前提或已知事实+约束”,
阅读全文Ilya 最新访谈,对整个大模型技术走向与行业发展做了研判:https://www.dwarkesh.com/p/ilya-sutskever-2下面是笔者关注到的几个非常有趣的点:一、模型的锯齿能力
阅读全文在几乎所有机器学习教材中,预测模型的目标只有一个:最小化损失函数,通常是 MSE。这导致一种长期默认:误差越小 = 模型越好,loss 越低 = 刻画越准。但现实中经常出现如下情况:模型误差很小,但预
阅读全文最近,Google 的 Nano Banana 刷屏。媒体与科技圈都在惊呼:图像生成的ChatGPT时刻来了,AI 正在吞噬人类的创造力。构图精准、风格统一、细节丰富,好像真的理解了世界,理解了审美,
阅读全文