Claude Opus 4.6 发布,跑分霸榜,价格不变
万众期待的 Sonnet 5 没来,Opus 4.6 先来了。Anthropic 今天发布了 Claude Opus 4.6,对自家最强模型做了一次全面升级:更会写代码,更能扛长任务,还学会了自己检查
阅读全文万众期待的 Sonnet 5 没来,Opus 4.6 先来了。Anthropic 今天发布了 Claude Opus 4.6,对自家最强模型做了一次全面升级:更会写代码,更能扛长任务,还学会了自己检查
阅读全文最早关注我的读者可能知道,我大概应该可能也许是全球第一个让 ChatGPT 开口说话的人。那是 ChatGPT 刚发布一周左右开始要火起来的时候,我徒手搓了个代码并录了一个视频,让 ChatGPT 3
阅读全文OpenClaw火的那几晚并非我想熬夜。而是信息更新的速度,比我刷新的手速还快。每隔十分钟就有新的讨论、新的测试、新的爆料。生怕错过什么重要动态,结果第二天醒来,脑子里全是碎片化的推文,什么都串不起来
阅读全文刚刚,OpenAI 把 Codex 做成了一个独立的桌面应用,这次,真的有点不一样。这次并非「换个壳重新包装一下」就扔出来了,而是,它可能真的会改变了我们用 AI Coding 的方式。许多读者应该会
阅读全文Anthropic 自己做了个实验,然后亲手打了自己产品一巴掌。Anthropic 刚刚发布了一篇研究论文,专门探讨一个扎心的问题:用 AI 辅助写代码,会不会让程序员变得更菜?结果令人意外:用了 A
阅读全文一刚刚,我的 claude code 崩了:已经是 2026 年的第 N 次了……这次拿下了我 130GB 的内存,超过了上次的 100 GB。这个内存泄露的 bug 有人碰到过吗?二看图(转自 X)
阅读全文1. 技术呈锯齿状指数增长,线性思维的30步只能跨越一室,指数增长的30步则能绕地球26圈,颠覆性创新正诞生于这一认知鸿沟之中。/ Elon Musk 2. AI 将大幅降低人脑认知负荷,可能导致大
阅读全文AI 生成的网页,终于不丑了!说实话,之前用 AI 生成网页,最怕的并非代码报错,而是生成出来那股子「AI 味儿」布局死板、配色平庸、一看就是模板脸。能用吗?能用。好看吗?真不好看。11 月的时候,谷
阅读全文1. 人人皆开发者的观点存在偏差,大量人群对构建技术产品兴趣不高。/ Mark Tenenholtz 2. 智能体编程带来的速度提升不仅体现在执行效率,更扩展了可开发领域。/ Andrej Karp
阅读全文1. AI 的发展表明我们对智力的传统定义存在偏差。/ Terence Tao 2. 技术行业正盲目追随某些技术路线,可能导致整个领域陷入创新的死胡同。/ Yann LeCun 3. 编码是实现
阅读全文1. 语言只是人类发明的符号系统,现实世界天上没有文字,遵循的是物理法则。/ Fei-Fei Li 2. 大语言模型是极其狭窄的研究领域,真正的智能体必须预测行为后果才能规划。/ Yann LeCu
阅读全文OpenAI 8 亿用户,一台 PostgreSQL 主库 + 50 个只读副本。这……听起来像是在开玩笑?但 OpenAI 刚发布的工程博客中写道:ChatGPT 背后的核心数据库,就是一个 Pos
阅读全文1. xAI 正在测试人类模拟器 AI 员工,逼真到现有员工有时分不清是在和机器人还是同事交流。/ The Information 2. AI 将在 6 到 12 个月内承担绝大多数甚至全部软件工程
阅读全文Anthropic 给 Claude 写了一本「为人处世」的教科书。这一份长达数万字的「宪法」文档,告诉了 Claude 应该成为什么样的存在、如何在这个世界上行事、甚至讨论了它是否可能拥有某种形式的
阅读全文1. AI 不会成为人类叙事的核心,我们天生关心的是人,不是机器。/ Sam Altma 2. 诺贝尔奖级别的超智能,2026到2027年仍有可能实现,这距离预期出人意料地接近。/ Dario Am
阅读全文1. 开发 AGI 的公司不应被激励去追求无限的利润。/ Ilya Sutskever 2. AGI 尚未突破发展的天花板,前方没有墙阻挡进步,但仍需 1 至 2 项重大技术突破。/ Demis H
阅读全文1. 中国 AI 模型可能仅落后美国几个月,这比一两年前的预期更快。唯一限制是缺乏 Transformer 这类基础架构的原创能力,但仅限于当下。/ Demis Hassabis 2. 2018年至
阅读全文1. 学习的主要感受应是努力感,而非乐趣,别把学习设计得太愉快。/ Andrej Karpathy 2. 计算机将从被编程向自我编程演进,未来是直接指示它去学日语,而非教它日语。/ Jensen Hu
阅读全文Anthropic 刚刚发布了第四份经济指数报告,这次他们搞了个 经济基元(economic primitives) 的新概念。简单来说,就是用五个基础指标来衡量 AI 的使用情况:任务复杂度、所需教
阅读全文1. 体验前沿 AI 产品后的30天内,不要做重大人生决定。/ Dan Shipper 2. 预测下一个 Token 的真正标准,是你是否理解了产生它的底层现实。/ Ilya Sutskever 3.
阅读全文当代码终结之后,软件该怎么写?Dan Shipper(Every 的联合创始人)和 Claude 联手写了一份技术指南,试图给出答案。这是一份构建 Agent 原生软件的完整技术指南。它系统性地总结了
阅读全文我们都知道,AI Agent 之所以强大有用,恰恰因为它们自主、灵活、智能。但这也恰恰让评估变得棘手。真正有效的评估策略,是把多种技术组合起来,让评估方法的复杂度匹配上被评估系统的复杂度。刚刚,一手打
阅读全文中国 AI,被「芯片之王」亲自盖章了。北京时间 1 月 6 日凌晨,拉斯维加斯 CES 2026 现场,身穿标志性皮衣的黄仁勋站在台上回顾 2025 年 AI 行业进展时,PPT 上赫然出现了三个中国
阅读全文Claude 养了一棵番茄,而且养活了。开发者 Martin DeVido 搭建了一个「生物舱」,让 Claude 全权负责照顾一株名叫 Sol 的番茄苗。没有人类备份,没有手动干预。也就是说:如果
阅读全文要把某个网页内容塞给大模型时,你会怎么做?请先投个票:有些网站已经走在了前面,比如智谱、OpenAI、火山的官方文档,贴心地提供了「复制 Markdown」按钮,一键就能拿到干净整洁的文本,非常 LL
阅读全文菲尔兹奖得主给当前 AI 下了个新定义。数学家陶哲轩 Terence Tao(@tao) 在 Mastodon 上给出了对当前 AI 能力的判断:我怀疑任何类似真正「通用人工智能」的东西,都不在当前
阅读全文开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。智谱再次放出大招,正式发布并开源 GLM-4.7!这是一款专为 Agentic Coding 打造的模型,在 LiveC
阅读全文还记得 Project Vend 吗?Anthropic 和合作伙伴 Andon Labs 在旧金山办公室搞了个实验:让 Claude 当店长,经营一家小店。第一阶段的表现嘛……可以说是惨不忍睹。这位
阅读全文