全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    IBM最新Agent优化综述:为什么你的Agent架构越来越臃肿却不变强?答案在工作流结构里

    作者:AI修猫Prompt发布日期:2026-04-02 20:30:57

    当下很多Agent框架都陷入同一种悖论:架构越来越复杂,效果却没有同步提升。链路更长、角色更多、工具更杂,规划、记忆、反思、验证层层叠加,带来的往往是更高的成本、更长的延迟和更脆弱的控制流,而不是真正

    阅读全文
  • 文章封面

    斯坦福MIT联合发布Meta-Harness,Agent端到端自己优化自己,Dspy一作Omar参与研究

    作者:AI修猫Prompt发布日期:2026-04-01 20:28:32

    去年讨论Agent落地时,重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot,怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升,控制数据流向、

    阅读全文
  • 文章封面

    TurboQuant逼近信息论极限,却用A100显卡「碾压」单核CPU:Google的底线在哪?

    作者:AI修猫Prompt发布日期:2026-03-30 20:12:11

    最近,如果您一直在关注装机市场或半导体股票,大概率被一个传闻刷屏了:“谷歌发布了一项名为TurboQuant的技术,能把AI模型的内存占用压缩到极限,直接导致了全球内存条价格暴跌。”资本市场和科技圈的

    阅读全文
  • 文章封面

    大部分人都没有的习惯,斯坦福最新报告证实:点踩对AI来说其实很重要!

    作者:AI修猫Prompt发布日期:2026-03-26 21:07:49

    您在使用LLM时,如果遇到它胡说八道或者彻底偏题,第一反应是什么?大概率是直接关掉窗口,新开一个对话,懒得跟机器废话。但您可能不知道,这个看似再正常不过的习惯,正在给下一代大语言模型的训练库疯狂“投毒

    阅读全文
  • 文章封面

    苏黎世联邦理工实测:一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

    作者:AI修猫Prompt发布日期:2026-03-24 19:30:00

    在构建多Agent系统(Multi-Agent Systems)时,让几个Agent互相“对话”并不难,但要让它们在局部状态不一致的情况下,敲定一个全局唯一的决策,也就是达成“一致”(Agree)或“

    阅读全文
  • 文章封面

    垃圾Skill太多,有用的少?试试EvoSkill,用帕累托前沿让你的Skill库始终极简与高效

    作者:AI修猫Prompt发布日期:2026-03-23 20:00:10

    您用OpenClaw或CC时有没有这样的感受?Skill越装越多,Agent解决问题的能力却没有越变越强。仓库里堆满了技能包:有些只修过一次特定报错,有些和已有技能高度重复,有些描述又长又空,真正调用

    阅读全文
  • 文章封面

    普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

    作者:AI修猫Prompt发布日期:2026-03-20 21:11:41

    OpenClaw-RL的核心价值在于:它能让您的OpenClaw🦞仅仅通过与你日常对话产生的自然反馈(如你的纠正、补充说明或环境报错),就能在后台实时自动更新权重,变得越来越符合您的个性化偏好,并在实

    阅读全文
  • 文章封面

    Agent Skills时代:强弱模型的差异到底有多大?戳破你的“平替”幻觉|牛津最新

    作者:AI修猫Prompt发布日期:2026-03-18 20:21:00

    目前,行业的开发焦点正快速向Openclaw等以Agent Skills为核心的框架收拢。大家已经达成共识:把重复的API链路写成可执行的Agent Skills,是解决长周期任务“上下文爆炸”的唯一

    阅读全文
  • 文章封面

    别怪你的OpenClaw像个乱挥锤子的外行,面对20万个Skills,它缺的是AgentSkillOS

    作者:AI修猫Prompt发布日期:2026-03-13 20:00:00

    自2025年10月Claude正式确立Agent Skills规范以来 ,Agent能力的边界正在被暴涨的脚本仓库迅速拓宽。截至2026年2月末,公开可用的Skills数量已突破28万大关 。回顾过去

    阅读全文
  • 文章封面

    连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

    作者:AI修猫Prompt发布日期:2026-03-11 20:00:00

    想象您是一名渗透测试工程师,面前是前几天宣布完成安全升级的OpenClaw 3.8。您不需要去找RCE(远程代码执行),也不用费劲构造缓冲区溢出。您只需要回想一下,近期在网上发生过的两场OpeClaw

    阅读全文
  • 文章封面

    只写一次性Prompt的龙虾是脆弱的:「SkillNet」发布面向Agent的ETL系统,已有20万高质量Skills

    作者:AI修猫Prompt发布日期:2026-03-06 23:50:26

    如果您近期在从事大型Agent系统的开发,或调试龙虾🦞,您应该已经感受到一个很具体的问题:当下的Agent(如OpenClaw)缺乏持久化的状态机与能力沉淀机制。在单次会话中,Agent或许能依靠长上

    阅读全文
  • 文章封面

    OpenClaw登顶Github背后的核心:用四元组状态机重新定义Agent Skills的系统级分类

    作者:AI修猫Prompt发布日期:2026-03-04 08:20:00

    伴随OpenClaw在昨天历史性地跨越25万Star关口,以插件化技能(Skills)驱动的Agent架构已经成为事实上的工业标准。当前生态中,每天都有数以万计的新技能被AI自动化流水线生成并分发。面

    阅读全文
  • 文章封面

    红队视角的OpenClaw:注入一段Markdown,接管你的Mac mini

    作者:AI修猫Prompt发布日期:2026-03-02 21:23:10

    如果您的Mac mini或个人服务器上正挂载着一个OpenClaw实例,并且您已经授权它接管您的私人电子邮件、飞书乃至社交软件,您可能需要审视一个严峻的架构安全问题:当外部网络中的非授权实体与您的龙虾

    阅读全文
  • 文章封面

    小模型+Agent Skills能用吗?这份基于POMDP的工业级本地化Agent报告太硬核!

    作者:AI修猫Prompt发布日期:2026-02-26 23:03:28

    各位对Agent Skill早已轻车熟路。不可否认,在Claude code、Openclaw的加持下,这套框架效果极佳。但工业界的痛点在于:它几乎沦为了超大型闭源API的专属玩具。当您的项目面临金融

    阅读全文
  • 文章封面

    Agent为什么都在疯狂外挂“Skills”?首个SkillsBench来了,讲透性能暴涨的底层逻辑

    作者:AI修猫Prompt发布日期:2026-02-24 22:40:17

    在2026当下的智能体(Agent)开发体系中,“为LLM加Skills”已经成为事实上的行业标准。您的Agent表现不好,是因为底层的LLM参数量不够,还是因为您喂给它的“Skills”写得一塌糊涂

    阅读全文
  • 文章封面

    CMU最新解密:当240万个OpenClaw聚在一起,RLHF竟成了最大的Bug

    作者:AI修猫Prompt发布日期:2026-02-23 23:18:24

    在传统的教育心理学中,"Peer Learning"(同伴学习)通常意味着互惠、提问和共同进步。但在Moltbook,这个有240万OpenClaw的AI Agent社交网络中,我们观察到了一种完全不

    阅读全文
  • 文章封面

    为什么大佬们连夜用Rust重写OpenClaw?看完这份34个高危场景的审计报告你就懂了

    作者:AI修猫Prompt发布日期:2026-02-22 20:00:00

    赋予一个AI模型不受限的终端访问权、任意文件读写能力以及你的私钥,这听起来像个不可理喻的架构灾难。但这正是OpenClaw爆火初期的默认形态。现实的毒打很快到来。随着社区中不断爆出凭证泄露和系统被意外

    阅读全文
  • 文章封面

    GLM-5最具破坏力的玩法来了!结合CC新出的Agent Teams,解锁Vibe coding终极形态!

    作者:AI修猫Prompt发布日期:2026-02-13 07:16:15

    就在10小时前,智谱AI正式发布了其年度旗舰模型GLM-5。当大多数人还在测试它的单点逻辑推理能力时,敏锐的开发者已经发现了一个更具破坏力的玩法:将GLM-5的高密度思维模型注入到Anthropic最

    阅读全文
  • 文章封面

    Meta用“战略竞拍”砍掉42%Agent API账单,小模型写标书,大模型当评委

    作者:AI修猫Prompt发布日期:2026-02-11 20:53:30

    无论是用OpenClaw,还是自己搭各种自动化流,只要重度使用AI Agent,就一定会遇到API账单和任务成功率的博弈:是用拉满的旗舰大模型保底,还是用便宜的小模型省钱?随着Agent对外部工具的使

    阅读全文
  • 文章封面

    Anthropic重磅:AI不会出现天网觉醒,但依然危险|ICLR 2026

    作者:AI修猫Prompt发布日期:2026-02-05 19:06:22

    长期以来,AI安全领域被一种令人战栗的假设所笼罩:我们害怕未来的超级智能会像《2001太空漫游》中的HAL 9000一样,以一种冷酷、高效且逻辑自洽的方式,为了执行错误的目标而毁灭人类(即“错位风险”

    阅读全文
  • 文章封面

    能「免费」体验OpenClaw了,不想买服务器和本地部署的可以看一下

    作者:AI修猫Prompt发布日期:2026-02-04 21:37:17

    OpenClaw最近实在是太火了。作为一款现象级的开源Agent项目,凭借超强的自主执行能力在GitHub上一路狂飙,吸引了无数开发者争相部署。如果您还不想购买云服务器,也不想把OpenClaw装在自

    阅读全文
  • 文章封面

    OpenAI发布Codex App,奥特曼下血本!限时「免费用+2倍速率」

    作者:AI修猫Prompt发布日期:2026-02-03 20:00:00

    我们都经历过这种时刻:让AI重构一个模块,结果它直接搞乱了本地环境,或者我们不得不傻坐在屏幕前看着代码逐行蹦出。2026年2月3号发布的OpenAI Codex App,似乎终于找到了解药。这款针对m

    阅读全文
  • 文章封面

    斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

    作者:AI修猫Prompt发布日期:2026-01-29 00:20:59

    为什么在LLM推理能力大幅跃升的2026,我们依然只有AI Copilot而没有AI Teammate?尽管AI编程工具遍地开花,但不管是Claude Code还是Codex,本质上仍是“单Agent

    阅读全文
  • 文章封面

    You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

    作者:AI修猫Prompt发布日期:2026-01-27 22:07:40

    我们都在System Prompt里写过无数次 You are a helpful assistant,但你是否想过:这行文字在模型的残差流(Residual Stream)中究竟对应着怎样的几何结构

    阅读全文
  • 文章封面

    谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

    作者:AI修猫Prompt发布日期:2026-01-26 08:33:25

    面对琳琅满目的Deep Research Agent(深度研究智能体),究竟该如何选型?本文基于OSU与Amazon最新发布的MMDR-Bench论文,为您提供一份经过严谨科学验证的“避坑指南”。结论

    阅读全文
  • 文章封面

    不用争CC、Codex哪个更好了,斯坦福众包设计了229个“变态”脏活已给出答案

    作者:AI修猫Prompt发布日期:2026-01-23 21:33:09

    谁才是真正的编程之王?是Claude Code加持下的Opus 4.5,还是Codex CLI的GPT-5.2,亦或是Google的Gemini 3 Pro?答案很残酷。尽管Claude Code被捧

    阅读全文
  • 文章封面

    简单却反直觉:通过「提示词重复」准确率从21.33飙升至97.33|谷歌重磅

    作者:AI修猫Prompt发布日期:2026-01-21 22:10:40

    竟然只需要一次Ctrl+V?这可能是深度学习领域为数不多的“免费午餐”。70组基准测试,47次完胜,0次失败。这是Google Research在Gemini、GPT-4o和DeepSeek V3上测

    阅读全文
  • 文章封面

    Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

    作者:AI修猫Prompt发布日期:2026-01-20 22:04:36

    这不是一个普通的Skill,而是一把“把经验变成Skill”的工具:Claudeception是一个Meta-Skill,即专门用来“生产技能”的技能。你写代码时最浪费的不是敲键盘,而是重复付出“第一

    阅读全文
  • 文章封面

    法律Agent最新万字综述:3大核心机制,5类应用版图|CMU/斯坦福联合发布

    作者:AI修猫Prompt发布日期:2026-01-19 21:41:07

    随着大语言模型(LLM)在特定领域应用的深入,学术界与产业界开始重新审视“独立模型”在处理复杂逻辑任务时的局限性。特别是在法律领域,现有的技术栈在应对长周期工作流(Long-cycle Workflo

    阅读全文
  • 文章封面

    沃顿商学院证明过的Agent Skills,Superpower狂揽23.7k star,CC、Codex直接用

    作者:AI修猫Prompt发布日期:2026-01-15 22:28:13

    这是一个拥有23.7k star的Skills开源项目。支持一键部署在Claude code、Codex以及最近非常火的Opencode。极客们选择它的原因很简单:它解决了Vibe coding中AI

    阅读全文
下一页