AI大模型调参指北笔记

LCR 051. 二叉树中的最大路径和
作者：AI大模型调参指北笔记发布日期：2025-11-08 09:31:00
困难路径被定义为一条从树中任意节点出发，沿父节点-子节点连接，达到任意节点的序列。同一个节点在一条路径序列中至多出现一次。该路径至少包含一个节点，且不一定经过根节点。路径和是路径中各节点
阅读全文
强化学习小白必看：PTX Loss 到底是个啥？
作者：AI大模型调参指北笔记发布日期：2025-11-07 21:00:00
PTX Loss（Pretraining Loss Extension）是强化学习（尤其是基于PPO的RLHF框架）中用于微调语言模型时引入的一种混合损失函数组件，旨在平衡模型在强化学习优化过程中的
阅读全文
最长递增子序列
作者：AI大模型调参指北笔记发布日期：2025-11-06 22:30:55
中等给你一个整数数组 nums ，找到其中最长严格递增子序列的长度。子序列是由数组派生而来的序列，删除（或不删除）数组中的元素而不改变其余元素的顺序。例如，[3,6,2,7] 是数组 [0,3,1
阅读全文
GPT-5 Prompt Migration and Improvement Using the New Optimizer
作者：AI大模型调参指北笔记发布日期：2025-11-05 21:00:00
GPT-5 系列模型是我们迄今为止发布的最智能的模型，在各方面的能力上都有了质的飞跃。GPT-5 特别擅长代理任务执行、编程和可控性，无论是好奇的用户还是高级研究人员，它都非常适用。GPT-5 将受
阅读全文
Task 异步流 coroutine 实现
作者：AI大模型调参指北笔记发布日期：2025-11-03 21:00:00
/** * @brief Standard C++20 coroutine-based Task implementation * @tparam T The result type of the
阅读全文
std::exception_ptr 的使用场景
作者：AI大模型调参指北笔记发布日期：2025-11-01 21:00:00
std::exception_ptr 是 C++11 中一个非常重要的工具，它让你能够捕获、存储和跨域（例如在不同函数或线程之间）传递异常，从而实现了更灵活的异常处理机制。下面这个表格总结了 std
阅读全文
C++ corotine 介绍
作者：AI大模型调参指北笔记发布日期：2025-10-29 22:00:00
C20 引入的协程（Coroutine）是一种可以暂停（suspend）和恢复（resume）执行的函数，它彻底改变了C处理异步操作和惰性生成数据序列的方式，让我们能够以同步的编码风格编写高效的异步
阅读全文
std::optional 和 std::nullopt
作者：AI大模型调参指北笔记发布日期：2025-10-28 22:00:00
std::optional 是 C++17 中引入的一个非常重要的模板类，用于清晰地表达一个值“可能存在”或“可能不存在”的语义。而 std::nullopt 则是一个用于明确表示“不存在”状态的常
阅读全文
搭建 VSCode 离线开发环境
作者：AI大模型调参指北笔记发布日期：2025-10-27 22:00:00
SSH 插件下载ssh 依赖三个插件：在这里插入图片描述下载插件，点击 Download VSIX:在这里插入图片描述到远程vscode上安装：在这里插入图片描述vscode-server 安装将$
阅读全文
nlohmann/json 库简介
作者：AI大模型调参指北笔记发布日期：2025-10-23 22:02:31
nlohmann/json 是一个专为现代 C++ 设计的 JSON 库，以其直观的 API、强大的功能性和卓越的易用性而广受欢迎。下面综合介绍其主要特性、安装集成、核心功能及适用场景。主要特性nl
阅读全文
Intro to C++ Coroutines: Concept
作者：AI大模型调参指北笔记发布日期：2025-10-22 22:00:00
各位开发者，时机已到。我们即将揭开 C++ 语言的最新概念——协程。它们已经被多种编程语言所采用，比如• C# 的异步任务和可生成迭代器，构成了 LINQ 的基础；• JavaScript 中的 a
阅读全文
Hugging Face BPE Tokenizer 的资源文件
作者：AI大模型调参指北笔记发布日期：2025-10-20 22:00:00
在Hugging Face等平台的大语言模型中，vocab.json、merges.txt 和 added_tokens.json 是分词器（Tokenizer）的核心配置文件。它们共同定义了如何将
阅读全文
移动语义 std::move 和完美转发 std::forward
作者：AI大模型调参指北笔记发布日期：2025-10-19 21:57:41
移动语义和完美转发是现代C++中用于提升程序效率的两个重要特性。下面这个表格清晰地展示了它们的主要特点。特性核心目标关键机制主要应用场景移动语义转移资源所有权，避免不必要的深拷贝，提升性能。右值引用
阅读全文
ACEBench: Who Wins the Match Point in Tool Usage?
作者：AI大模型调参指北笔记发布日期：2025-10-14 21:35:00
Abstract大型语言模型（LLMs）在决策和推理方面已展现出显著的潜力，尤其是在与各种工具相结合的情况下，能够有效地解决复杂问题。然而，目前用于评估 LLMs 工具使用能力的基准存在一些局限性：
阅读全文
什么是左值和右值
作者：AI大模型调参指北笔记发布日期：2025-10-13 21:00:00
左值和右值是编程中用于区分表达式两种不同性质的核心概念，理解它们对于掌握C/C++等语言的内存管理和性能优化至关重要。下面这个表格能帮你快速把握它们的主要区别：特性左值 (Lvalue)右值 (Rv
阅读全文
什么是 GN
作者：AI大模型调参指北笔记发布日期：2025-10-12 14:28:25
什么是 GNGNgn与ninja类似于cmake和makeGN 是 Google 开发的一种元构建系统（Meta-Build System），用于生成 Ninja 构建文件（.ninja）。核心功能
阅读全文
RULER: Relative Universal LLM-Elicited Rewards
作者：AI大模型调参指北笔记发布日期：2025-10-09 22:09:49
在这里插入图片描述“RULER（Relative Universal LLM-Elicited Rewards）”是一种通用型奖励函数，它利用语言模型作为评判者来对多个智能体的行动轨迹进行排序。该机
阅读全文
古寺步道
作者：AI大模型调参指北笔记发布日期：2025-10-04 16:52:08
阅读全文
阿基米德水系
作者：AI大模型调参指北笔记发布日期：2025-09-28 18:41:38
阅读全文
SFT和RFT的区别
作者：AI大模型调参指北笔记发布日期：2025-09-25 21:00:00
SFT（监督微调）和RFT（强化学习微调）是优化大型语言模型（LLMs）的两种核心技术，它们在理念、实现方式和适用场景上有着显著区别。下面这张表格汇总了它们的主要差异，方便你快速了解：对比维度监督微
阅读全文
CosyVoice 3: 面向真实场景的大规模零样本语音生成模型
作者：AI大模型调参指北笔记发布日期：2025-09-16 21:00:00
一、研究背景与目标问题定位：• 前作局限：CosyVoice 2虽实现低延迟流式合成和接近人声的质量，但在语言覆盖（仅中英文）、领域多样性（广播场景为主）、数据规模（万小时级）和文本鲁棒性（特殊符号
阅读全文
逆转诅咒：在 A=B 上训练的语言模型无法学习 B=A
作者：AI大模型调参指北笔记发布日期：2025-09-09 22:07:09
论文揭示了自回归大型语言模型（LLMs）在逻辑泛化上的一个根本性缺陷，即“逆转诅咒”（Reversal Curse）。以下是论文的核心内容：在这里插入图片描述比较早的论文了，现在是否还存在这个问题有
阅读全文
CosyVoice 3: Towards In-the-wild Speech Generation
作者：AI大模型调参指北笔记发布日期：2025-09-04 21:40:34
Abstract在我们之前的工作中，我们推出了一个可扩展的流式语音合成模型 CosyVoice 2，它将大型语言模型（LLM）与分块感知流匹配（FM）模型相结合，实现了低延迟的双流语音合成和人类同等
阅读全文
语音合成（TTS）中文自然度：问题、成因、解决方案
作者：AI大模型调参指北笔记发布日期：2025-09-03 21:00:00
我们来深度解析这篇关于中文语音合成（TTS）自然度问题、成因与解决方案的文章。文章结构清晰，内容深入，聚焦于中文TTS的独特挑战和前沿解决方案。核心主题：提升中文TTS的自然度，关键在于解决其特有
阅读全文
上下文工程如何实现
作者：AI大模型调参指北笔记发布日期：2025-09-02 21:00:00
核心技术更长的上下文并不一定会产生更好的响应，上下文过载可能会导致应用程序以意想不到的方式失败，上下文可能会变得有害、分散注意力、令人困惑或产生冲突。• 上下文污染（Context Poisonin
阅读全文
上下文工程（Context Engineering）
作者：AI大模型调参指北笔记发布日期：2025-09-01 21:00:00
背景目前Prompt工程已相对成熟，已有大量最佳实践和工具支持。但Prompt工程有一定的局限性，想象一下，你正在使用大模型解决一个复杂的工作问题，传统的做法是精心设计一个提示词，希望一次性得到满意
阅读全文
新手必看！LangGraph 101：手把手教你搭一个深度研究 Agent
作者：AI大模型调参指北笔记发布日期：2025-08-28 21:24:08
构建能够在实际中真正发挥作用的大型语言模型（LLM）程序并非易事。您需要考虑如何协调这一多步骤的工作流程，跟踪各参与者的状态，实施必要的限制措施，并实时监控决策过程。幸运的是，LangGrap
阅读全文
LangGraph 简介
作者：AI大模型调参指北笔记发布日期：2025-08-26 21:06:31
在这里插入图片描述LangGraph 是由 LangChain 团队开发的开源框架，专为构建状态化、多智能体（Multi-Agent）动态工作流而设计。它通过图结构（Graph）管理复杂任务流程，
阅读全文
SFT 泛化新解读：强化学习 + 奖励修正，一文读懂
作者：AI大模型调参指北笔记发布日期：2025-08-21 21:18:09
1. 研究背景与问题• SFT的局限性：传统监督微调（SFT）在LLM任务适配中简单高效，但泛化能力弱于强化学习（RL）。RL依赖奖励信号探索策略，但计算成本高且需人工设计奖励函数。• 核心问题：能
阅读全文
程序员狂喜！Self-Instruct 框架全解析：无限生成高质量指令集，从此告别标注噩梦！
作者：AI大模型调参指北笔记发布日期：2025-08-19 21:51:07
在这里插入图片描述MotivationHigh-level overview of InstructGPT with human annotated outputs and ranking for
阅读全文