全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

    作者:AI修猫Prompt发布日期:2025-08-14 20:48:05

    幻觉,作为AI圈家喻户晓的概念,这个词您可能已经听得耳朵起茧了。我们都知道它存在,也普遍接受了它似乎无法根除,是一个“老大难”问题。但正因如此,一个更危险的问题随之而来:当我们对幻觉的存在习以为常时,

    阅读全文
  • 文章封面

    AI代码生成,上下文示例怎样写最有效?港科大最新

    作者:AI修猫Prompt发布日期:2025-08-12 21:03:04

    长久以来我们都知道在Prompt里塞几个好例子能让LLM表现得更好,这就像教小孩学东西前先给他做个示范。在Vibe coding爆火后,和各种代码生成模型打交道的人变得更多了,大家也一定用过上下文学习

    阅读全文
  • 文章封面

    Agent怎么运维?中科院清华重磅发布:AgentOps来了!

    作者:AI修猫Prompt发布日期:2025-08-08 16:46:22

    从“模型即服务”(MaaS)到“智能体即服务”(AaaS)的转变,标志着AI行业进入了新的发展阶段。我们不再满足于AI的“对话能力”,而是期望它能成为自主完成复杂任务的“全能机器人”。但当我们兴奋地将

    阅读全文
  • 文章封面

    腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

    作者:AI修猫Prompt发布日期:2025-08-07 05:30:00

    当AI智能体(Agent)开发的浪潮涌来,很多一线工程师却发现自己站在一个尴尬的十字路口:左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”,右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和

    阅读全文
  • 文章封面

    gpt-oss专为Agent而生,16G显存就能跑,昨晚开源。

    作者:AI修猫Prompt发布日期:2025-08-06 04:59:09

    昨晚OpenAI官方放了个大招,发布了gpt-oss-120b和gpt-oss-20b两款开源模型,这是一个专为Agent而生的模型,而且开源了。这背后其实藏着OpenAI对未来AI应用形态,特别是A

    阅读全文
  • 文章封面

    RAG也能推理思考!彻底解决多源异构知识难题

    作者:AI修猫Prompt发布日期:2025-08-04 21:19:22

    现在的RAG(检索增强生成)系统。您给它一个简单直接的问题,它能答得头头是道;可一旦问题需要稍微拐个弯,或者知识源一复杂,它就立刻“拉胯”,要么返回一堆不相干的东西,要么干脆就开始一本正经地胡说八道。

    阅读全文
  • 文章封面

    你的Prompt已达性能极限?试试这个0成本的优化 | 马里兰大学最新

    作者:AI修猫Prompt发布日期:2025-08-01 16:00:51

    上下文学习(In-Context Learning, ICL)、few-shot,经常看我文章的朋友几乎没有人不知道这些概念,给模型几个例子(Demos),它就能更好地理解我们的意图。但问题来了,当您

    阅读全文
  • 文章封面

    LLM产品开发边界究竟在哪,我们终将面对AI的归纳偏差,哈佛MIT重磅研究

    作者:AI修猫Prompt发布日期:2025-07-30 18:37:51

    几百年前开普勒通过观测数据,总结出了行星运动的规律,例如行星沿椭圆轨道运行,这让他能精确预测行星未来的位置。这就像今天的基础模型,通过学习海量数据,可以很好地进行序列预测(比如接下一句话)。后来牛顿提

    阅读全文
  • 文章封面

    上下文灾难有救了,Claude Sub-Agent的隐藏功能,99%的开发者还没发现

    作者:AI修猫Prompt发布日期:2025-07-28 21:40:55

    Claude Code中的Sub Agents是专门化的AI助手,可以被调用来处理特定类型的任务。它们通过提供具有自定义系统提示、工具和独立上下文窗口的任务特定配置,从而实现更高效的问题解决。—Ant

    阅读全文
  • 文章封面

    上下文工程难吗?试下Claude Code写入Kiro的Spec,自动搞定上下文

    作者:AI修猫Prompt发布日期:2025-07-25 23:58:04

    10天前Amazon发布了他们自己的开发平台,Kiro IDE,其中有一个很厉害的交互功能“Spec(Specification)”,强调的是规范的文档,说明书,以一套非常结构化的方法确保开发过程的系

    阅读全文
  • 文章封面

    上下文工程怎么用?三星SDS这个E2E的Agent案例说明白了

    作者:AI修猫Prompt发布日期:2025-07-11 21:59:55

    今年5月,SAMSUNG SDS发布了一份财务费用自动化处理的案例研究报告。当时,"Context Engineering"这个概念还没有成为AI圈的热词,大部分工程师还沉浸在Prompt Engin

    阅读全文
  • 文章封面

    复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025

    作者:AI修猫Prompt发布日期:2025-07-10 21:46:47

    您有没有遇到过这样的场景:为了调试一个LLM应用的效果,您需要在一大堆Python代码中翻找那些零散的提示词字符串?每次想要A/B测试不同的提示时,就像在做开颅手术一样小心翼翼。IBM研究团队最近发布

    阅读全文
  • 文章封面

    剑桥UCL重磅发布:Vibe Coding深度报告,这才是“人机协同”的最终形态

    作者:AI修猫Prompt发布日期:2025-07-09 21:33:21

    编者按:vibe coding不是编程的终点,而是Context Engineering驱动的协作智能的起点。那些能够最早理解并应用这种整合视角的人,将在下一轮技术变革中获得决定性优势。自今年2月AI

    阅读全文
  • 文章封面

    第一性原理的Context Engineering工具、指南

    作者:AI修猫Prompt发布日期:2025-07-08 21:27:40

    就像是播放音乐,Prompt Engineering是在调音响的音量,那Context Engineering就是在设计整个音响系统,从音源、功放、音箱到房间声学,每个环节都要精心设计。Context

    阅读全文
  • 文章封面

    Context Engineering不是造新词,IBM揭示LLM推理的认知秘密

    作者:AI修猫Prompt发布日期:2025-07-07 21:45:49

    当LangChain在6月23日发布那篇著名的Context Engineering博客时,IBM Research的研究者们早在10天前就已经用严格的学术实验证明了这套方法的有效性。只不过那时候上下

    阅读全文
  • 文章封面

    GitHub上5.4k+Star爆火,构建生产级Agent 的12因素

    作者:AI修猫Prompt发布日期:2025-07-04 20:42:43

    这是一篇在GitHub上获得5.3k+星标的重要技术文档,其中蕴含的洞察值得每一位AI产品开发者深度思考。作者Dex是一位资深的AI工程师,他试遍了市面上几乎所有的Agent框架——从广受欢迎的Lan

    阅读全文
  • 文章封面

    别瞧不起「提示词」芝大论文爆火:Prompt Science已被定义

    作者:AI修猫Prompt发布日期:2025-07-03 21:37:13

    最近网上出现了一些很有趣的声音——"提示词已死"、"写提示词把自己写死了",这些文章认为随着模型变得越来越智能,精心设计提示词的时代已经过去了。但芝加哥大学的最新研究却给出了完全相反的结论:promp

    阅读全文
  • 文章封面

    Doc2Agent“爬”了所有API文档,一键API,MCP简单了

    作者:AI修猫Prompt发布日期:2025-06-27 21:24:21

    我想问您一个问题:上次为了让AI代理调用某个第三方API,您花了多长时间写包装代码?一天?三天?还是一周?不过现在,Brandeis大学的研究者们带来了一个让人眼前一亮的解决方案——Doc2Agent

    阅读全文
  • 文章封面

    连不上Gemini CLI,试下DeepSeek-R1接入Claude code

    作者:AI修猫Prompt发布日期:2025-06-26 22:06:10

    这两天Google推出了Gemini-CLI这个编程工具,功能和Claude Code基本一致,结果根本排不上队,登录一下很快闪退,和下图一样,使用感受令人不愉悦。很多人都在等着体验这个新工具,但现实

    阅读全文
  • 文章封面

    放弃幻想!伯克利重磅:消灭幻觉,就是消灭AI!

    作者:AI修猫Prompt发布日期:2025-06-22 21:37:50

    关于大模型产生幻觉这个事,从2023年GPT火了以后,就一直是业界津津乐道的热门话题,但始终缺乏系统性的重磅研究来深入解释其根本机制。今天,伯克利的研究者们带来一个重要研究成果:让基于Transfor

    阅读全文
  • 文章封面

    能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

    作者:AI修猫Prompt发布日期:2025-06-19 21:28:21

    剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文,直接挑战了当前Agent开发的核心假设:我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mih

    阅读全文
  • 文章封面

    未来「含人量」多少,决定你值多少钱?斯坦福发布2025年重磅AI「工作内参」

    作者:AI修猫Prompt发布日期:2025-06-18 22:03:44

    您最近是不是老听同事讨论"我的工作会被AI替代吗"?别慌,斯坦福大学刚刚发布了一份重磅研究报告,用史上最大规模的数据告诉您真相。你敢想象吗?你的工作“含人量”多少,决定你值多少钱?“含人量”是我首次创

    阅读全文
  • 文章封面

    微软已为Agent悄然调转船头,当大厂都在卷“通用Agent”

    作者:AI修猫Prompt发布日期:2025-06-17 21:43:45

    您有没有这样的体验?一天的工作里,您可能用GPTo3写了个方案,然后切换到Cursor或者Trae里写代码,接着又打开Notion或者飞书整理文档。每个工具都挺聪明,但它们彼此之间就像生活在平行宇宙—

    阅读全文
  • 文章封面

    Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

    作者:AI修猫Prompt发布日期:2025-06-15 21:57:21

    G-Memory研究团队 投稿新加坡国立大学、同济大学等 | 技术解读自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增1

    阅读全文
  • 文章封面

    专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

    作者:AI修猫Prompt发布日期:2025-06-13 06:50:00

    您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤

    阅读全文
  • 文章封面

    别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

    作者:AI修猫Prompt发布日期:2025-06-12 00:03:13

    还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在

    阅读全文
  • 文章封面

    14种主流Prompt技术,顶级团队2000次实验,只有这几种真能打

    作者:AI修猫Prompt发布日期:2025-06-11 00:03:00

    现在市面上有46种Prompt工程技术(论文中引用的数据,和我去年这个时候介绍的论文是一致的《防骗| 连这些引用量最高的核心Prompt都不知道,还敢打着专家大师旗号蒙人》),但真正能在软件工程任务中

    阅读全文
  • 文章封面

    沃顿商学院重磅Prompt报告:别再对AI"循循善诱"了!我们在错误地使用它!

    作者:AI修猫Prompt发布日期:2025-06-10 00:26:50

    宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告,通过严格的科学实验揭示了一个令人震惊的事实:我们可能一直在用错误的方式与AI对话。这不是胡说八道,而是基于近4万次实验得出的硬核数据

    阅读全文
  • 文章封面

    LLM已进入「组装」时代,CAIS复合人工智能系统来了

    作者:AI修猫Prompt发布日期:2025-06-09 06:40:00

    2024年,伯克利人工智能研究中心(BAIR)率先提出了一个新概念——复合人工智能系统(Compound AI Systems,简称CAIS)。这个看似简单的术语背后,蕴含着AI系统架构的根本性改变:

    阅读全文
  • 文章封面

    大语言模型(LLM)面试50题(含答案)

    作者:AI修猫Prompt发布日期:2025-06-07 22:49:13

    通过这份全面指南探索大语言模型(LLMs)的关键概念、技术和挑战,专为AI爱好者和准备面试的专业人士精心打造。引言大语言模型(LLMs)正在革命性地改变人工智能领域,支持从聊天机器人到自动化内容创建的

    阅读全文
上一页下一页