模型的自我进化,可能真的开始了。
昨天Hermes Agent更新了0.13.0。终于支持原生Windows了。 之前电脑的wsl坏了,一直懒得折腾,终于可以体验一下了。安装具简单,管理员启动PowerSheell 一行命令搞定:ir
阅读全文昨天Hermes Agent更新了0.13.0。终于支持原生Windows了。 之前电脑的wsl坏了,一直懒得折腾,终于可以体验一下了。安装具简单,管理员启动PowerSheell 一行命令搞定:ir
阅读全文Claude Code之父Boris在红杉 2026 AI Ascent 上说:一年后,Claude Code 可能只剩 100 行代码。模型足够聪明时,你不需要那么多脚手架。OpenAI 前不久的博
阅读全文OpenAI昨天发了一份报告,说top5%的企业,人均token消耗是中位数企业的3.5倍。 而且这个差距还在持续增长。假期的时候,codex 推出了 /goal的功能,不达目标誓不罢休。 玩法多样。
阅读全文假期的时候,红衫AI Ascent 2026 上有两场值得认真看的演讲。一场是 Boris Cherny 的,Claude Code 之父。一场是 Karpathy 的。两个人从不同角度把同一件事讲清
阅读全文Anthropic 的 Opus 4.7 黑客松结束了。500人参赛,10万美元奖池,一周时间,最多两人组队。获奖名单出来,我愣住了。。。金奖:土耳其的一个医生。 银奖:法国的老哥做了一个电路板维修工
阅读全文Google开源了一个新的格式规范: DESIGN.md。对于所有在用AI coding的人来说,这可能是今年最实用的东西之一。这是一个把产品UI设计定死的一个文件约束。避免模型自己去搞一些AI味儿,
阅读全文MCP is Dead. Long Live the CLI.2个月前,Eric Holmes给MCP定义了结局。因为LLM本来就很会用命令行,搞一层协议纯属多此一举。因为,MCP本身就有,Token
阅读全文上周 kimi k2.6、GPT 5.5、DeepSeek v4 扎堆上线了。全网都在疯狂推送各种新闻稿,通稿。每一篇都在讲 ds v4 多猛、gpt 5.5 多强。可能看很多篇,内容大差不差。这个场
阅读全文这2个月,家里有一个小朋友。5岁,皮起来整栋楼都能听见他声音。。。。 这几周,被迫。各种花式陪娃,用 Nano Banana Pro 搓绘本,用Seedance 跑视频。。。还买了一堆拼图,但是我发
阅读全文我觉得现在有一件特别荒诞的事儿。团队里边,每个人都有自己的Agent,可能是Cursor、Claude Code 或者 Codex之类的。单看每个人的产出,其实都挺高的,AI工具确实让所有人的效率提高
阅读全文今天被 Image 2 刷了一整天的屏。朋友圈、公众号、x、群聊,全是各种AI图。信息图、假报纸、漫画、杂志封面、直播截图。说真的,质量确实离谱。连这种图都可以做。。。。我也手痒了。但是作为一个普通玩
阅读全文Kimi K2.6发布并开源了,代码、Agent能力大幅提升。龙虾又可以换更好的国产模型替代了。Claude Code的源码前不久泄露了,这事儿大家应该都知道了。因为还缺了一些东西,所以想在本地把这东
阅读全文Hermes Agent 太火了。自进化真的太好玩了,用久了回不去。最近为了快速看一些开源项目,我搓了一个小工具。类似于deepwiki、zread那种,完整拆解一个github项目。但是Mermai
阅读全文最近在折腾Hermes Agent的时候,在官网看到了一个东西。飞书,竟然是对龙虾输出支持最好的平台。我有点懵,因为飞书我平时很少在用。所以,我特地去搜了一下,发现最近飞书在打通龙虾、爱马仕圈的评价真
阅读全文Anthropic小课堂又开课了。全网一天到晚的讲Harness工程概念,看的都麻木了。A社说,先从这一步来把,管理Session、Context、Compaction、Branching,这些都实打
阅读全文Claude-Mem、LLM Wiki、mem_base、Claude + Obsidian、AI Knowledge Layer ...各种新名词、开源工具,又一次让持久记忆、第二大脑、知识层,成为
阅读全文模型智力已经在线了。无论中国还是外国的模型都OK。我不需要模型再进步了,它已经超过一般人的智商水平一大块了。我就希望它能真正帮我把事儿做好。昨晚听了一场关于Harness Engineering的直播
阅读全文周末,Karpathy大佬的编程经验开源skills项目火了。它做的事情特别简单,就是把 Karpathy 吐槽大模型写代码的那些问题,编译成大模型可以理解的约束,周末星星疯涨。Karpathy 原话
阅读全文假期的时候,Karpathy 大神发了一个llm.wiki的想法。 这条推文火爆了。在LLM Agent时代,分享具体代码或应用的意义正在变弱,现在只需要分享想法,然后把它交给 Claude、Grok
阅读全文Anthropic今天发了一个新的产品。定位是: 你不用做Harness了,我帮你做。模型的局限性我最清楚,我来按模型特性设计 Harness,打包卖给你。而这个包,就是 Managed Agents
阅读全文Hermes Agent 势头很猛,这几天推荐的人很多。被很多大佬认为这是,龙虾以来,第一个真正意义上的竞争对手了。img我自己装了玩了下,我感觉这个设计思路蛮有意思。看完它的架构,第一反应是:这个东
阅读全文前几天 Claude Code 源码泄露之后,50万的源码。相信大家最大的问题是, Claude Code 的核心到底怎么实现的?有没有 Python 版的参考实现?我想在其基础上做自己的 Codin
阅读全文上周写Harness Engineering的时候 Anthropic说:不要在等下一代模型了,立刻马上做Harness!,Anthropic极力想传达的结论是:真正稀缺的能力不在模型里面,在模型外面
阅读全文我做了一件挺蠢的事。最近在调试一个N合一的视频生成的skills,天天去官方排队用Seedance 2.0跑视频。每天13万人排队,中下午排队2小时起步,凌晨十几分钟一个视频。直到有个朋友给我说:你是
阅读全文Claude Code 昨天被“被动开源”了。预计国产Coding工具,近一个月会迎来一波史诗级加强。今天不聊源码,聊 Skill。当大家都可以安装部署自己的Claude Code,(源码缺失了一些东
阅读全文Qwen3.5-Omni发布了。昨晚看到官方推送,千问终于更新了一波Omni这个全模态系列。不过,早上看群友发的截图。Qwen 3.6 似乎也要来了。上午试玩了一波。依旧,输入测支持图、视频、文本。
阅读全文OpenAI 宣布关停 Sora,25 个月便黯然退场,只为腾算力备战 IPO,连迪士尼巨额合作也告吹。反而国内 AI 视频发展迅猛,多款产品年收入可观,创作者与生成视频数量庞大。核心差异在于国内工具
阅读全文Anthropic Claude Code 产品负责人 Cat Wu ,最近聊了聊他们团队的产品经理现在到底怎么干活的。说实话,整个看下来,这其实就是一套产品的 Harness Engineering
阅读全文最近几周,从全面养虾,到百虾大战WorkBuddy、jvs claw、ArkClaw... 这些大厂疯狂推出自己的消费级Agent产品。试图重新定义的个人效率?但有一个事实,很少有人提:2026年了,
阅读全文同一个模型,什么都没换。数据没换,提示词没换,只换了模型外面包的那层运行环境,编程基准的成功率从 42% 跳到了 78%。这个数据来自 Nate B Jones 的一项研究。变量只有一个:模型外面的壳
阅读全文