AI修猫Prompt

SKILL.md不够用了：北大提出SSL，Agent需要一套自己的结构化表示层
作者：AI修猫Prompt发布日期：2026-05-07 08:23:41
Agent Skills不应该只以SKILL.md、README或自然语言说明文档的形式存在，而应该被转成一种机器可检索、可检查、可治理的结构化表示。这是《From Skill Text to Ski
阅读全文
UC伯克利联合斯坦福提出「Combee」：蜂群Agent的Prompt Learning正式进入并行时代！
作者：AI修猫Prompt发布日期：2026-05-04 22:17:09
Agent正在进入并行时代。Claude Code、OpenClaw等具有代表性的系统都在让多个Agent同时工作。Prompt Learning的价值，就是让一组Agent在运行中持续沉淀经验。区别
阅读全文
SkVM：优化你的Skills能够跨模型、跨Harness、跨环境稳定运行｜SJTU最新
作者：AI修猫Prompt发布日期：2026-04-26 12:39:48
如果您经常用Claude Code、OpenCode、OpenClaw这类Agent框架，大概率会遇到一种不稳定现象：同一个Skills，用Claude能跑，换成Qwen就不行了；在Claude Co
阅读全文
都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？
作者：AI修猫Prompt发布日期：2026-04-21 20:06:14
阿里前几天开源的Qwen3.6-35B-A3B，让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争，一边又必须回答一个更麻烦的问题：相较于 Qwen3.5
阅读全文
UPenn提出Graph of Skills：把海量Skill连成技能图｜CC可用、支持Minimax2.7
作者：AI修猫Prompt发布日期：2026-04-16 20:00:00
很多人以为，给Agent装上更多Skill，它就会变得更强。但现实往往正好相反：当Skill库从几十个膨胀到几千、几万个时，Agent最先失去的，往往不是推理能力，而是“找对Skill”的能力。Ag
阅读全文
Harness，才是Agent时代统管一切的基座｜交大综述解读Memory、Skills、Protocols
作者：AI修猫Prompt发布日期：2026-04-14 08:02:00
2026年再看Agent，一个越来越难回避的事实是：能力正在从模型里流到模型外。真正决定系统上限的，不再只是参数、Prompt和tool calling，而是记忆、技能、协议以及统摄这一切的harne
阅读全文
Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！
作者：AI修猫Prompt发布日期：2026-04-08 11:03:00
对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情
阅读全文
谷歌的Gemma-4-31B适合哪些人？值得你放弃Qwen3.5-27B吗？深度调研战略报告
作者：AI修猫Prompt发布日期：2026-04-06 06:46:45
Gemma4 31B的发布，在开源模型社区引发了巨大的关注。面对这款由谷歌DeepMind于2026年4月2日推出的重磅模型，很多技术团队和本地部署玩家都在问同一个问题：Gemma4的出现，到底是在
阅读全文
IBM最新Agent优化综述：为什么你的Agent架构越来越臃肿却不变强？答案在工作流结构里
作者：AI修猫Prompt发布日期：2026-04-02 20:30:57
当下很多Agent框架都陷入同一种悖论：架构越来越复杂，效果却没有同步提升。链路更长、角色更多、工具更杂，规划、记忆、反思、验证层层叠加，带来的往往是更高的成本、更长的延迟和更脆弱的控制流，而不是真正
阅读全文
斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究
作者：AI修猫Prompt发布日期：2026-04-01 20:28:32
去年讨论Agent落地时，重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot，怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升，控制数据流向、
阅读全文
TurboQuant逼近信息论极限，却用A100显卡「碾压」单核CPU：Google的底线在哪？
作者：AI修猫Prompt发布日期：2026-03-30 20:12:11
最近，如果您一直在关注装机市场或半导体股票，大概率被一个传闻刷屏了：“谷歌发布了一项名为TurboQuant的技术，能把AI模型的内存占用压缩到极限，直接导致了全球内存条价格暴跌。”资本市场和科技圈的
阅读全文
大部分人都没有的习惯，斯坦福最新报告证实：点踩对AI来说其实很重要！
作者：AI修猫Prompt发布日期：2026-03-26 21:07:49
您在使用LLM时，如果遇到它胡说八道或者彻底偏题，第一反应是什么？大概率是直接关掉窗口，新开一个对话，懒得跟机器废话。但您可能不知道，这个看似再正常不过的习惯，正在给下一代大语言模型的训练库疯狂“投毒
阅读全文
苏黎世联邦理工实测：一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了
作者：AI修猫Prompt发布日期：2026-03-24 19:30:00
在构建多Agent系统（Multi-Agent Systems）时，让几个Agent互相“对话”并不难，但要让它们在局部状态不一致的情况下，敲定一个全局唯一的决策，也就是达成“一致”（Agree）或“
阅读全文
垃圾Skill太多，有用的少？试试EvoSkill，用帕累托前沿让你的Skill库始终极简与高效
作者：AI修猫Prompt发布日期：2026-03-23 20:00:10
您用OpenClaw或CC时有没有这样的感受？Skill越装越多，Agent解决问题的能力却没有越变越强。仓库里堆满了技能包：有些只修过一次特定报错，有些和已有技能高度重复，有些描述又长又空，真正调用
阅读全文
普林斯顿开源OpenClaw-RL：使用不中断还能自进化，对话就有「反向传播信号」太猛了！
作者：AI修猫Prompt发布日期：2026-03-20 21:11:41
OpenClaw-RL的核心价值在于：它能让您的OpenClaw🦞仅仅通过与你日常对话产生的自然反馈（如你的纠正、补充说明或环境报错），就能在后台实时自动更新权重，变得越来越符合您的个性化偏好，并在实
阅读全文
Agent Skills时代：强弱模型的差异到底有多大？戳破你的“平替”幻觉｜牛津最新
作者：AI修猫Prompt发布日期：2026-03-18 20:21:00
目前，行业的开发焦点正快速向Openclaw等以Agent Skills为核心的框架收拢。大家已经达成共识：把重复的API链路写成可执行的Agent Skills，是解决长周期任务“上下文爆炸”的唯一
阅读全文
别怪你的OpenClaw像个乱挥锤子的外行，面对20万个Skills，它缺的是AgentSkillOS
作者：AI修猫Prompt发布日期：2026-03-13 20:00:00
自2025年10月Claude正式确立Agent Skills规范以来，Agent能力的边界正在被暴涨的脚本仓库迅速拓宽。截至2026年2月末，公开可用的Skills数量已突破28万大关。回顾过去
阅读全文
连Gemini都直呼“着迷”的木马，如果你的龙虾token耗太快，是该注意「Clawdrain攻击」了
作者：AI修猫Prompt发布日期：2026-03-11 20:00:00
想象您是一名渗透测试工程师，面前是前几天宣布完成安全升级的OpenClaw 3.8。您不需要去找RCE（远程代码执行），也不用费劲构造缓冲区溢出。您只需要回想一下，近期在网上发生过的两场OpeClaw
阅读全文
只写一次性Prompt的龙虾是脆弱的：「SkillNet」发布面向Agent的ETL系统，已有20万高质量Skills
作者：AI修猫Prompt发布日期：2026-03-06 23:50:26
如果您近期在从事大型Agent系统的开发，或调试龙虾🦞，您应该已经感受到一个很具体的问题：当下的Agent（如OpenClaw）缺乏持久化的状态机与能力沉淀机制。在单次会话中，Agent或许能依靠长上
阅读全文
OpenClaw登顶Github背后的核心：用四元组状态机重新定义Agent Skills的系统级分类
作者：AI修猫Prompt发布日期：2026-03-04 08:20:00
伴随OpenClaw在昨天历史性地跨越25万Star关口，以插件化技能（Skills）驱动的Agent架构已经成为事实上的工业标准。当前生态中，每天都有数以万计的新技能被AI自动化流水线生成并分发。面
阅读全文
红队视角的OpenClaw：注入一段Markdown，接管你的Mac mini
作者：AI修猫Prompt发布日期：2026-03-02 21:23:10
如果您的Mac mini或个人服务器上正挂载着一个OpenClaw实例，并且您已经授权它接管您的私人电子邮件、飞书乃至社交软件，您可能需要审视一个严峻的架构安全问题：当外部网络中的非授权实体与您的龙虾
阅读全文
小模型+Agent Skills能用吗？这份基于POMDP的工业级本地化Agent报告太硬核！
作者：AI修猫Prompt发布日期：2026-02-26 23:03:28
各位对Agent Skill早已轻车熟路。不可否认，在Claude code、Openclaw的加持下，这套框架效果极佳。但工业界的痛点在于：它几乎沦为了超大型闭源API的专属玩具。当您的项目面临金融
阅读全文
Agent为什么都在疯狂外挂“Skills”？首个SkillsBench来了，讲透性能暴涨的底层逻辑
作者：AI修猫Prompt发布日期：2026-02-24 22:40:17
在2026当下的智能体（Agent）开发体系中，“为LLM加Skills”已经成为事实上的行业标准。您的Agent表现不好，是因为底层的LLM参数量不够，还是因为您喂给它的“Skills”写得一塌糊涂
阅读全文
CMU最新解密：当240万个OpenClaw聚在一起，RLHF竟成了最大的Bug
作者：AI修猫Prompt发布日期：2026-02-23 23:18:24
在传统的教育心理学中，"Peer Learning"（同伴学习）通常意味着互惠、提问和共同进步。但在Moltbook，这个有240万OpenClaw的AI Agent社交网络中，我们观察到了一种完全不
阅读全文
为什么大佬们连夜用Rust重写OpenClaw？看完这份34个高危场景的审计报告你就懂了
作者：AI修猫Prompt发布日期：2026-02-22 20:00:00
赋予一个AI模型不受限的终端访问权、任意文件读写能力以及你的私钥，这听起来像个不可理喻的架构灾难。但这正是OpenClaw爆火初期的默认形态。现实的毒打很快到来。随着社区中不断爆出凭证泄露和系统被意外
阅读全文
GLM-5最具破坏力的玩法来了！结合CC新出的Agent Teams，解锁Vibe coding终极形态！
作者：AI修猫Prompt发布日期：2026-02-13 07:16:15
就在10小时前，智谱AI正式发布了其年度旗舰模型GLM-5。当大多数人还在测试它的单点逻辑推理能力时，敏锐的开发者已经发现了一个更具破坏力的玩法：将GLM-5的高密度思维模型注入到Anthropic最
阅读全文
Meta用“战略竞拍”砍掉42%Agent API账单，小模型写标书，大模型当评委
作者：AI修猫Prompt发布日期：2026-02-11 20:53:30
无论是用OpenClaw，还是自己搭各种自动化流，只要重度使用AI Agent，就一定会遇到API账单和任务成功率的博弈：是用拉满的旗舰大模型保底，还是用便宜的小模型省钱？随着Agent对外部工具的使
阅读全文
Anthropic重磅：AI不会出现天网觉醒，但依然危险｜ICLR 2026
作者：AI修猫Prompt发布日期：2026-02-05 19:06:22
长期以来，AI安全领域被一种令人战栗的假设所笼罩：我们害怕未来的超级智能会像《2001太空漫游》中的HAL 9000一样，以一种冷酷、高效且逻辑自洽的方式，为了执行错误的目标而毁灭人类（即“错位风险”
阅读全文
能「免费」体验OpenClaw了，不想买服务器和本地部署的可以看一下
作者：AI修猫Prompt发布日期：2026-02-04 21:37:17
OpenClaw最近实在是太火了。作为一款现象级的开源Agent项目，凭借超强的自主执行能力在GitHub上一路狂飙，吸引了无数开发者争相部署。如果您还不想购买云服务器，也不想把OpenClaw装在自
阅读全文
OpenAI发布Codex App，奥特曼下血本！限时「免费用+2倍速率」
作者：AI修猫Prompt发布日期：2026-02-03 20:00:00
我们都经历过这种时刻：让AI重构一个模块，结果它直接搞乱了本地环境，或者我们不得不傻坐在屏幕前看着代码逐行蹦出。2026年2月3号发布的OpenAI Codex App，似乎终于找到了解药。这款针对m
阅读全文