谷歌发布多代理系统高效上下文工程指南:AI开发者注意了!(建议收藏)
谷歌刚刚发布了一份重磅指南,聚焦于多智能体系统中的高效上下文工程。这对AI开发者来说绝对值得关注!(强烈建议收藏)https://developers.googleblog.com/en/archit
阅读全文谷歌刚刚发布了一份重磅指南,聚焦于多智能体系统中的高效上下文工程。这对AI开发者来说绝对值得关注!(强烈建议收藏)https://developers.googleblog.com/en/archit
阅读全文由 Sora 生成大多数开发者在不同项目里都在重复相同的环境搭建、调试或数据清洗工作。选对库可以把这些日常重复动作自动化,省下大量时间和精力。下面这些库能在一周内悄悄帮你省下好几个小时。它们简化 lo
阅读全文照片来自 Jason Yuen,发布于 Unsplash小工具,大作用。The Python Toolbelt:12 个能解决大问题的小型库发现一打容易被忽视的 Python 库,它们安静地让开发更顺
阅读全文大家好!我从事大语言模型(LLM)的微调工作已经超过两年了。在这段时间里,从 BERT 到 Llama、Qwen、ChatGLM……我踩过不少坑,也积累了不少经验。今天,我想和大家分享一个非常实用的话
阅读全文在 Sora 中生成几乎每位开发者都经历过因缺少数据而测试受阻的时刻。你做了一个 API、表单或 dashboard,但没有足够真实的输入,测试结果就缺乏参考意义。手动编造假邮箱、手机号或地址,对付几
阅读全文2025年已成为AI智能体元年!8月,国务院发布了《关于深入实施“人工智能+”行动的意见》,明确提出到2030年实现“智能体等应用普及率超90%”的目标。同时,AI智能体正以前所未有的速度走向产业核心
阅读全文一家高速成长的电商初创公司的工程团队正在进行一场经典讨论。他们的推荐引擎需要语义搜索来将用户查询与数百万条商品描述匹配。他们该选择像 Qdrant 或 Pinecone 这样的专用向量数据库,还是使用
阅读全文本次我在《FastAPI+Streamlit打造一套智能体应用GUI展示平台》的基础上加入了三点更新:使用 PostgreSQL 作为 Checkpointer,将 LangGraph Agent 从
阅读全文在 LangChain 中,消息(Message)是模型上下文的基本单元。它们代表了模型的输入和输出,在与LLM交互时,承载着对话状态所需的内容和元数据。消息具有以下属性:角色(Role):标识消息类
阅读全文12月的第一天想和大家分享的这本书,是信息论的开山之作——《通信的数学理论》。克劳德·香农(Claude Shannon)提出了一个非常惊人的观点:信息是可以被量化的。他用“熵”来衡量信息的不确定性,
阅读全文打造真正好用的 AI 工具:Python、FastAPI 与 LangChain 一次搞懂为什么你的 AI 脚本值得更好的呈现方式想象你做了个很酷的 AI 模型,会回答问题或总结文本。在 Jupyte
阅读全文大型语言模型(LLM)是一种强大的 AI 工具,能够像人类一样理解与生成文本。它们具有高度通用性,可以用于写作、翻译、摘要和问答等任务,而无需针对每个任务进行额外的专业训练。除了文本生成之外,许多模型
阅读全文优化 Agentic 方案离不开软件工程:要让各组件能够协调协作、并行运行,并能高效与系统交互。比如 Speculative Execution(推测执行),通过提前处理可预测的请求来降低延迟;再比如
阅读全文在过去的几天,我一直在思考如何以更简单更高效地形式学习 LangChain 和 LangGraph 1.0 的特性,好在让我探索出了一条道路:在做中学!前几天我发表了一篇关于 AgengHub 的文章
阅读全文在大语言模型(LLM)的世界里,有一个长期困扰工程师和研究者的“不可能三角”:推理速度、生成质量、计算成本——三者难以兼得。尤其是速度与质量之间的权衡,几乎成了行业共识:自回归模型(如GPT系列):质
阅读全文今天我们来探讨一次 RAG 效率的大飞跃。为什么传统 RAG 会又慢又浪费传统 RAG 流水线常见做法是把一堆检索到的文本 chunk 塞进 prompt,然后交给 LLM 处理。但这些 chunk
阅读全文Learn how to effectively create tools for your AI agents. Image by ChatGPT.AI agents 是由一系列 LLM 调用组成的
阅读全文在《LangChain1.0教程:给我们的RAG智能体加上记忆功能》中我们已经学会了如何在 Juyputer Notebook 中构造一个具有记忆能力的 RAG Agent。虽然 Juyputer N
阅读全文所谓 Agentic systems,无论用于工具使用还是推理,都是通过 prompts 来引导行动。但 prompts 是静态的,它们只给出步骤,却无法自我改进。真正的 agentic traini
阅读全文Agentic RAG 系统可以被视为一个“高维向量空间”,其中每个维度都对应一次设计决策,例如 prompt engineering、agent 协同、retrieval 策略等。手动调优这些维度以
阅读全文📌 简短结论:强得离谱,但并非全能首先,大家应该都看过各种基准测试了——所以我不再重复“谁更强”的争论。但根据我亲手测试的结果:Gemini 3 是目前我见过最接近“真实智能”的模型,尤其在硬核编程任
阅读全文随着人工智能大模型技术加速落地,私有化部署正成为企业兼顾数据安全与业务定制化的首选路径。然而,企业在部署过程中普遍面临技术选型混乱、资源错配、安全合规风险高等痛点,亟需一套科学、可操作的部署与评价体系
阅读全文基于模拟 FAQ 文档构建的 knowledge graph今天我带来一个基于 knowledge graph(用第一部分介绍的方法构建)和 LLM(这里用的是 Gemma3–4b-it-qat,与之
阅读全文我们之前在《LangChain1.0教程:使用RAG Agent和RAG Chain构建RAG智能体》文章中介绍的 RAG Agent 可以调用检索工具回答用户的问题,但是这个 Agent 仅仅能完成
阅读全文如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases
阅读全文大家有没有这种感觉: 明明只想让大模型看10段资料,它偏偏要硬塞100段,消耗的token数像火箭一样增长,速度还慢得像乌龟?恭喜你,这个行业通病,Meta今天直接给治好了。他们刚开源了一个叫 REF
阅读全文你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文
阅读全文最近谷歌悄悄放了一个超级大招——70页全免费的《Context Engineering: Sessions & Memory》白皮书,直接把“让AI拥有真正记忆”这件事讲得透彻到骨子里。这不是普通的博
阅读全文所谓 Agentic systems,无论用于工具使用还是推理,都是通过 prompts 来引导行动。但 prompts 是静态的,它们只给出步骤,却无法自我改进。真正的 agentic traini
阅读全文