PyTorch研习社

谷歌发布多代理系统高效上下文工程指南：AI开发者注意了！（建议收藏）
作者：PyTorch研习社发布日期：2025-12-07 21:15:04
谷歌刚刚发布了一份重磅指南，聚焦于多智能体系统中的高效上下文工程。这对AI开发者来说绝对值得关注！（强烈建议收藏）https://developers.googleblog.com/en/archit
阅读全文
13 个能加速你工作流的 Python 库
作者：PyTorch研习社发布日期：2025-12-07 21:15:04
由 Sora 生成大多数开发者在不同项目里都在重复相同的环境搭建、调试或数据清洗工作。选对库可以把这些日常重复动作自动化，省下大量时间和精力。下面这些库能在一周内悄悄帮你省下好几个小时。它们简化 lo
阅读全文
Python: 12 个能解决大问题的小型库
作者：PyTorch研习社发布日期：2025-12-06 21:30:08
照片来自 Jason Yuen，发布于 Unsplash小工具，大作用。The Python Toolbelt：12 个能解决大问题的小型库发现一打容易被忽视的 Python 库，它们安静地让开发更顺
阅读全文
两年实战总结：5 大参数高效微调（PEFT）技术全解析！
作者：PyTorch研习社发布日期：2025-12-05 18:53:58
大家好！我从事大语言模型（LLM）的微调工作已经超过两年了。在这段时间里，从 BERT 到 Llama、Qwen、ChatGLM……我踩过不少坑，也积累了不少经验。今天，我想和大家分享一个非常实用的话
阅读全文
5 款生成测试用假数据的最佳工具
作者：PyTorch研习社发布日期：2025-12-05 18:53:58
在 Sora 中生成几乎每位开发者都经历过因缺少数据而测试受阻的时刻。你做了一个 API、表单或 dashboard，但没有足够真实的输入，测试结果就缺乏参考意义。手动编造假邮箱、手机号或地址，对付几
阅读全文
全国首部AI智能体应用评估标准正式启动
作者：PyTorch研习社发布日期：2025-12-04 09:38:16
2025年已成为AI智能体元年！8月，国务院发布了《关于深入实施“人工智能+”行动的意见》，明确提出到2030年实现“智能体等应用普及率超90%”的目标。同时，AI智能体正以前所未有的速度走向产业核心
阅读全文
PostgreSQL 向量检索：可用于生产，还是过度炒作？
作者：PyTorch研习社发布日期：2025-12-03 21:40:28
一家高速成长的电商初创公司的工程团队正在进行一场经典讨论。他们的推荐引擎需要语义搜索来将用户查询与数百万条商品描述匹配。他们该选择像 Qdrant 或 Pinecone 这样的专用向量数据库，还是使用
阅读全文
FastAPI+Streamlit打造一套智能体应用GUI展示平台（更新）
作者：PyTorch研习社发布日期：2025-12-02 08:14:53
本次我在《FastAPI+Streamlit打造一套智能体应用GUI展示平台》的基础上加入了三点更新：使用 PostgreSQL 作为 Checkpointer，将 LangGraph Agent 从
阅读全文
LangChain1.0：Message（消息）
作者：PyTorch研习社发布日期：2025-12-02 08:14:53
在 LangChain 中，消息（Message）是模型上下文的基本单元。它们代表了模型的输入和输出，在与LLM交互时，承载着对话状态所需的内容和元数据。消息具有以下属性：角色（Role）：标识消息类
阅读全文
信息论之父香农的开山之作《通信的数学理论》中文版正式发布！
作者：PyTorch研习社发布日期：2025-12-01 08:00:00
12月的第一天想和大家分享的这本书，是信息论的开山之作——《通信的数学理论》。克劳德·香农（Claude Shannon）提出了一个非常惊人的观点：信息是可以被量化的。他用“熵”来衡量信息的不确定性，
阅读全文
打造真正好用的 AI 工具：Python、FastAPI 与 LangChain 一次搞懂
作者：PyTorch研习社发布日期：2025-11-30 20:32:40
打造真正好用的 AI 工具：Python、FastAPI 与 LangChain 一次搞懂为什么你的 AI 脚本值得更好的呈现方式想象你做了个很酷的 AI 模型，会回答问题或总结文本。在 Jupyte
阅读全文
LangChain1.0：使用大模型
作者：PyTorch研习社发布日期：2025-11-29 20:03:41
大型语言模型（LLM）是一种强大的 AI 工具，能够像人类一样理解与生成文本。它们具有高度通用性，可以用于写作、翻译、摘要和问答等任务，而无需针对每个任务进行额外的专业训练。除了文本生成之外，许多模型
阅读全文
构建 Agentic AI 的 14 个关键点
作者：PyTorch研习社发布日期：2025-11-28 23:07:36
优化 Agentic 方案离不开软件工程：要让各组件能够协调协作、并行运行，并能高效与系统交互。比如 Speculative Execution（推测执行），通过提前处理可预测的请求来降低延迟；再比如
阅读全文
LangChain1.0快速体验
作者：PyTorch研习社发布日期：2025-11-27 20:45:07
在过去的几天，我一直在思考如何以更简单更高效地形式学习 LangChain 和 LangGraph 1.0 的特性，好在让我探索出了一条道路：在做中学！前几天我发表了一篇关于 AgengHub 的文章
阅读全文
NVIDIA新论文引爆AI圈：TiDAR架构一举破解大模型“速度 vs 质量”世纪难题！
作者：PyTorch研习社发布日期：2025-11-26 21:33:17
在大语言模型（LLM）的世界里，有一个长期困扰工程师和研究者的“不可能三角”：推理速度、生成质量、计算成本——三者难以兼得。尤其是速度与质量之间的权衡，几乎成了行业共识：自回归模型（如GPT系列）：质
阅读全文
RAG 太慢？如何将延迟削减 97%
作者：PyTorch研习社发布日期：2025-11-26 21:33:17
今天我们来探讨一次 RAG 效率的大飞跃。为什么传统 RAG 会又慢又浪费传统 RAG 流水线常见做法是把一堆检索到的文本 chunk 塞进 prompt，然后交给 LLM 处理。但这些 chunk
阅读全文
高效地为智能体创造工具
作者：PyTorch研习社发布日期：2025-11-25 22:34:16
Learn how to effectively create tools for your AI agents. Image by ChatGPT.AI agents 是由一系列 LLM 调用组成的
阅读全文
FastAPI+Streamlit打造一套智能体应用GUI展示平台
作者：PyTorch研习社发布日期：2025-11-24 22:04:27
在《LangChain1.0教程：给我们的RAG智能体加上记忆功能》中我们已经学会了如何在 Juyputer Notebook 中构造一个具有记忆能力的 RAG Agent。虽然 Juyputer N
阅读全文
让 AI 学会“自我修炼”：自我改进智能体训练体系全解析
作者：PyTorch研习社发布日期：2025-11-23 20:34:40
所谓 Agentic systems，无论用于工具使用还是推理，都是通过 prompts 来引导行动。但 prompts 是静态的，它们只给出步骤，却无法自我改进。真正的 agentic traini
阅读全文
构建一套可自我改进的 Agentic RAG 系统
作者：PyTorch研习社发布日期：2025-11-22 20:12:50
Agentic RAG 系统可以被视为一个“高维向量空间”，其中每个维度都对应一次设计决策，例如 prompt engineering、agent 协同、retrieval 策略等。手动调优这些维度以
阅读全文
智能体写代码就是香
作者：PyTorch研习社发布日期：2025-11-21 19:26:10
AI 生成的图片（概念与提示由作者撰写）有那么一个夜晚，我差点关掉编辑器，开始怀疑自己是否还属于这个行业。我做了所有“正确”的事。多年经验。整洁的提交。扎实的评审。然而我眼看着更年轻的开发者交付功能
阅读全文
我对 Gemini 3 的真实体验
作者：PyTorch研习社发布日期：2025-11-20 08:00:00
📌 简短结论：强得离谱，但并非全能首先，大家应该都看过各种基准测试了——所以我不再重复“谁更强”的争论。但根据我亲手测试的结果：Gemini 3 是目前我见过最接近“真实智能”的模型，尤其在硬核编程任
阅读全文
全国首部AI大模型私有化部署标准，公开征集起草单位和个人！
作者：PyTorch研习社发布日期：2025-11-19 10:13:07
随着人工智能大模型技术加速落地，私有化部署正成为企业兼顾数据安全与业务定制化的首选路径。然而，企业在部署过程中普遍面临技术选型混乱、资源错配、安全合规风险高等痛点，亟需一套科学、可操作的部署与评价体系
阅读全文
大模型赋能知识图谱构建问答系统
作者：PyTorch研习社发布日期：2025-11-18 22:14:41
基于模拟 FAQ 文档构建的 knowledge graph今天我带来一个基于 knowledge graph（用第一部分介绍的方法构建）和 LLM（这里用的是 Gemma3–4b-it-qat，与之
阅读全文
LangChain1.0教程：给我们的RAG智能体加上记忆功能
作者：PyTorch研习社发布日期：2025-11-17 18:08:57
我们之前在《LangChain1.0教程：使用RAG Agent和RAG Chain构建RAG智能体》文章中介绍的 RAG Agent 可以调用检索工具回答用户的问题，但是这个 Agent 仅仅能完成
阅读全文
Google 让 RAG 变得前所未有地简单：全新 File Search 工具震撼登场
作者：PyTorch研习社发布日期：2025-11-17 18:08:57
如果你曾尝试自己搭一套 RAG（Retrieval-Augmented Generation，检索增强生成），你大概懂那种痛：要管理 embeddings（向量嵌入）、vector databases
阅读全文
Meta宣布彻底解决RAG最大痛点：速度提升30倍，上下文窗口暴增16倍，成本直接腰斩！
作者：PyTorch研习社发布日期：2025-11-16 21:34:18
大家有没有这种感觉：明明只想让大模型看10段资料，它偏偏要硬塞100段，消耗的token数像火箭一样增长，速度还慢得像乌龟？恭喜你，这个行业通病，Meta今天直接给治好了。他们刚开源了一个叫 REF
阅读全文
RAG 真的能“不暴露私有数据”吗？答案是：可以
作者：PyTorch研习社发布日期：2025-11-16 21:34:18
你是否认真考虑过 RAG 流水线中的文档隐私？这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文
阅读全文
谷歌70页硬核上下文工程白皮书免费送！
作者：PyTorch研习社发布日期：2025-11-15 20:31:30
最近谷歌悄悄放了一个超级大招——70页全免费的《Context Engineering: Sessions & Memory》白皮书，直接把“让AI拥有真正记忆”这件事讲得透彻到骨子里。这不是普通的博
阅读全文
让 AI 学会“自我修炼”：自我改进智能体训练体系全解析
作者：PyTorch研习社发布日期：2025-11-15 20:31:30
所谓 Agentic systems，无论用于工具使用还是推理，都是通过 prompts 来引导行动。但 prompts 是静态的，它们只给出步骤，却无法自我改进。真正的 agentic traini
阅读全文