Google 让 RAG 变得前所未有地简单:全新 File Search 工具震撼登场
如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases
阅读全文如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases
阅读全文大家有没有这种感觉: 明明只想让大模型看10段资料,它偏偏要硬塞100段,消耗的token数像火箭一样增长,速度还慢得像乌龟?恭喜你,这个行业通病,Meta今天直接给治好了。他们刚开源了一个叫 REF
阅读全文你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文
阅读全文最近谷歌悄悄放了一个超级大招——70页全免费的《Context Engineering: Sessions & Memory》白皮书,直接把“让AI拥有真正记忆”这件事讲得透彻到骨子里。这不是普通的博
阅读全文所谓 Agentic systems,无论用于工具使用还是推理,都是通过 prompts 来引导行动。但 prompts 是静态的,它们只给出步骤,却无法自我改进。真正的 agentic traini
阅读全文大多数 AI “助手”一旦你关掉聊天窗口就把一切忘得一干二净。它们记不住你的名字、你的偏好,甚至记不住你昨天才告诉它的一件小事。这就是我觉得 OpenMemory 有趣的原因。它是开源的、可在本地运行
阅读全文写出更简洁、更聪明的 Python 函数!别再用错误的方式写 Python 函数!改用这些做法!避开常见错误,学习最佳实践,让你的 Python 函数更高效、更易读。Python 是一门很棒的语言——
阅读全文LLM 最强大的应用之一就是基于检索增强生成(Retrieval Augmented Generation,RAG)的问答(Q&A)聊天机器人。本教程将通过 RAG Agent 和 RAG Chain
阅读全文你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文
阅读全文“AI会不会取代程序员?”——这个萦绕在无数开发者心头的问题,早已不再是简单的“是”或“否”可以回答。随着人工智能技术的迅猛发展,真正的分水岭已经出现:不是AI是否会取代程序员,而是那些拒绝拥抱AI工
阅读全文现在构建 agents 真是件麻烦事。如果你曾在 n8n 里花上几个小时拉线接 Nodes,或者被某个莫名其妙的 API auth 问题折腾得头大,你就知道我在说什么。那感觉就像教一个机器人煮咖啡——
阅读全文学习如何借助 Stanford 的 Agentic Context Engineering 构建能自我纠错并自动优化性能的自适应数据库查询系统作者使用 AI 生成的图片当下大多数 Text-to-SQ
阅读全文在这个视频中我介绍了如何给智能体添加记忆,以及中间件和工具的使用方法。记忆对于智能体来说,记忆(memory)非常关键——它让智能体能够记住过去的交互、从反馈中学习、并根据用户偏好进行调整。当智能体处
阅读全文Prompts 确立意图。Context 选择事实、历史和工具输出,让 AI 在长任务中保持连贯。Image by Planet Volumes on Unsplash在这个领域的第一幕里,我们沉迷于
阅读全文在 LangChain 中,消息是模型上下文的基本单元。它们代表模型的输入和输出,承载着与 LLM 交互时表示对话状态所需的内容和元数据。消息是包含以下内容的对象:role:标识消息类型(例如,sys
阅读全文学习如何借助 Stanford 的 Agentic Context Engineering 构建能自我纠错并自动优化性能的自适应数据库查询系统作者使用 AI 生成的图片当下大多数 Text-to-SQ
阅读全文LLM(大语言模型)是功能强大的 AI 工具,能够像人类一样理解和生成文本。它们用途广泛,无需针对每项任务进行专门训练,即可完成内容撰写、语言翻译、摘要撰写和问题回答等任务。除了文本生成之外,许多模型
阅读全文当文档包含复杂表格、数学公式或多栏排版时,传统 OCR 工具往往会产出杂乱内容,需要手动整理。就在上周,我逛 GitHub 时看到了百度新近开源的 PaddleOCR-VL-0.9B。老实讲,看到它只
阅读全文LangChain1.0 正式发布有几天了,和之前比起来,我感觉优化点还是不少的,起码能让大家清楚明白什么时候该用 LangChain,什么时候该用 LangGraph了。如果你希望快速构建智能体和自
阅读全文当文档包含复杂表格、数学公式或多栏排版时,传统 OCR 工具往往会产出杂乱内容,需要手动整理。就在上周,我逛 GitHub 时看到了百度新近开源的 PaddleOCR-VL-0.9B。老实讲,看到它只
阅读全文在这个项目中,我构建了一个由 AI 驱动的聊天机器人,它可以将自然语言问题转换为 SQL 查询,并直接从真实的 SQLite 数据库中检索答案。借助 LangChain、Hugging Face Em
阅读全文阿里云提供的 “OpenAI 兼容接口”主要是为了支持标准 OpenAI API 调用。但是并不是完全兼容:尤其是当我们使用下面的方式期待模型产生结构化输出时:from pydantic import
阅读全文GPT-5、Claude Opus 4……Agent 技术真的能干活儿了。2025 年 8 月,OpenAI 发布的 GPT-5,可不仅仅是个能说会道的 AI。它在编码、推理方面的能力都有了很大提升,
阅读全文在 LangGraph 中基于结构化数据源构建在 LangGraph 中构建不同的 agent 系统 | Image by author如果你刚开始搭建不同的 agentic 系统,一个有趣的切入点是
阅读全文🧩 一、从一个简单的问题开始有没有一种办法,能让计算机判断:“这些逻辑条件能不能同时成立?”这看似简单的问题,其实就是现代自动推理的核心:SAT(命题可满足性)与 SMT(带理论的可满足性)。它们是形
阅读全文上周我不小心组了一支开发团队。只是……这支“团队”其实就我、Claude Code 和 Codex 三个,分坐在屏幕两边,像两位彼此勉强容忍的对手工程师。说实话?这简直是_magic_。 如果你想在不
阅读全文很多 RAG 系统失败,并不是因为 LLM 不够聪明,而是因为它们的架构太简单。它们试图用线性的一次性方式,处理一个本质上循环、多步骤的问题。许多复杂查询需要推理、反思,以及何时行动的聪明决策,这与我
阅读全文我们接着此前的两篇文章学习如何使用LangGraph构建一个复杂的可用于生产的RAG系统。此前的两篇文章可以访问下方链接查看:Python+LangGraph+RAGAS构建一个复杂的、可用于生产的R
阅读全文在此前的文章中我介绍了:Python+LangGraph+RAGAS构建一个复杂的、可用于生产的RAG系统我们首先由构建知识库开始介绍如何一步步地构建这个复杂的、可用于生产的RAG系统。在这里,我们将
阅读全文很多 RAG 系统失败,并不是因为 LLM 不够聪明,而是因为它们的架构太简单。它们试图用线性的一次性方式,处理一个本质上循环、多步骤的问题。许多复杂查询需要推理、反思,以及何时行动的聪明决策,这与我
阅读全文