全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Kimi-Audio 的 TTS 效果如何?

    作者:AI大模型调参指北笔记发布日期:2025-06-09 21:07:45

    Kimi-Audio开放了模型和推理脚本,但不支持TTS推理。魔改了模型可以支持TTS的任务,能同时输出文本和音频。测试发现:1. audio的输出和text的输出有时会不同步,即内容不一致。一般音

    阅读全文
  • 文章封面

    RLHF及其变体:进展和实际工程见解

    作者:AI大模型调参指北笔记发布日期:2025-06-06 21:00:00

    Background2022年底,OpenAI关于InstructGPT的论文b[1]引发了人们对人类反馈强化学习(RLHF)的广泛兴趣,现在通常被称为后训练。核心概念包括使用配对偏好数据集结合ra

    阅读全文
  • 文章封面

    晦涩难懂的 Flow matching!图形化理解

    作者:AI大模型调参指北笔记发布日期:2025-06-05 21:00:00

    每个生成模型理想情况下都是一个密度估计器;因此,它会建模一个概率密度,最终是一个联合概率分布(JPD),具有两个预期特性,即采样和压缩。压缩基本上是将数据推送到信息空间,这看起来维度更低,而采样则是

    阅读全文
  • 文章封面

    校园篇-北京信息科技大学2025

    作者:AI大模型调参指北笔记发布日期:2025-05-31 10:00:00

    北京信息科技大学,北京市重点支持建设的高校,原名北京信息工程学院,隶属于电子工业部,1997年合并成立新的北京信息工程学院,2008年改现名,有沙河、小营、金台路和酒仙桥四个校区,占地81万余平方米,

    阅读全文
  • 文章封面

    Simhash-文档去重算法简介

    作者:AI大模型调参指北笔记发布日期:2025-05-29 21:30:51

    在计算机科学领域,SimHash 是一种用于快速估算两个集合相似度的技术。谷歌利用该算法来查找近乎重复的网页(Detecting Near-Duplicates for Web Crawling)。

    阅读全文
  • 文章封面

    Address Sanitizer in C++

    作者:AI大模型调参指北笔记发布日期:2025-05-28 21:02:38

    AddressSanitizer (ASan)是一种调试工具,用于检测c++程序中的内存错误。它的工作原理是在程序编译的二进制代码中插入特殊的工具,这允许它监视内存访问,并检测程序何时试图访问无效或已

    阅读全文
  • 文章封面

    Telling gcc directly to link a library statically

    作者:AI大模型调参指北笔记发布日期:2025-05-27 21:15:00

    It feels strange to me to use -Wl,-Bstatic in order to tell gcc which libraries I want to link with

    阅读全文
  • 文章封面

    亲测有效!如何用 Address Sanitizer 精准定位内存漏洞?附保姆级操作指南

    作者:AI大模型调参指北笔记发布日期:2025-05-26 22:04:48

    Address Sanitizer是谷歌开发的检测 use-after-free、内存泄漏等内存访问错误的工具。它内置在GCC版本>= 4.8中,可以在C和c++代码中使用。Address Sanit

    阅读全文
  • 文章封面

    教娃编程系列|RPG 游戏 – 移动动画

    作者:AI大模型调参指北笔记发布日期:2025-05-24 10:00:00

    为了完成玩家精灵的移动机制,我们还剩下一个功能叫做动画。如果你有视频和动画的经验,你会知道视频是通过运行许多静止的图像来创建一个移动的效果。这里我们在做同样的事情。我们有近10个Player在移动时的

    阅读全文
  • 文章封面

    要用 AI 裁员 50% 的千亿独角兽,公开认错,重启招聘!

    作者:AI大模型调参指北笔记发布日期:2025-05-22 21:00:00

    估值超过1000 亿元,正在筹备美股上市的独角兽公司 Klarna,其 CEO 最近公开承认:公司在过去几年采用的以 AI 为中心的战略,是错误的!图片来源:Klarna从 2023 年开始,Klar

    阅读全文
  • 文章封面

    一些文档去重算法

    作者:AI大模型调参指北笔记发布日期:2025-05-21 21:00:00

    在讨论 SimHash 之前,让我们先回顾一下其他一些也能识别重复内容的方法。Longest Common Subsequence(LCS)这就是diff命令所使用的算法。它也是一种编辑距离,仅包含

    阅读全文
  • 文章封面

    single codebook和dual codebook在LLM中向量量化上有什么区别?

    作者:AI大模型调参指北笔记发布日期:2025-05-19 21:00:00

    think嗯,我现在得弄清楚single codebook和dual codebook在大型语言模型(LLM)的向量量化方面有什么区别。首先,我需要回顾一下向量量化的基本概念,然后再看看这两种不同的

    阅读全文
  • 文章封面

    富贵迷人眼

    作者:AI大模型调参指北笔记发布日期:2025-05-18 11:24:31

    阅读全文
  • 文章封面

    阳光明媚吗,刘桑?

    作者:AI大模型调参指北笔记发布日期:2025-05-17 11:28:34

    阅读全文
  • 文章封面

    什么是置信度?置信度模型怎么做?

    作者:AI大模型调参指北笔记发布日期:2025-05-16 21:00:00

    Abstract在本文中,我们描述了用于从医学对话中提取临床相关信息的新组件,这些组件将作为Google API提供。我们描述了一个基于transformer的 Recurrent Neural Ne

    阅读全文
  • 文章封面

    0:6横扫阵风!中国歼10CE外销封神,福建舰的“六代机”要逆天?​​

    作者:AI大模型调参指北笔记发布日期:2025-05-15 10:00:00

    阅读全文
  • 文章封面

    红黑树是啥?

    作者:AI大模型调参指北笔记发布日期:2025-05-14 20:59:51

    二叉搜索树是一种基本的数据结构,但如果树变得不平衡,它们的性能就会受到影响。红黑树是一种平衡的二叉搜索树,它使用一组规则来保持平衡,确保插入、删除和搜索等操作的对数时间复杂度,而不管树的初始形状如何。

    阅读全文
  • 文章封面

    FSQ的原理与VQ-VAE的区别和联系

    作者:AI大模型调参指北笔记发布日期:2025-05-13 21:00:00

    论文的标题是《Finite Scalar Quantization: VQ-VAE Made Simple》,顾名思义,这是一篇旨在用FSQ(Finite Scalar Quantization)简化

    阅读全文
  • 文章封面

    多进程中的 fork 与 spawn:为什么你的 GPU 加速会踩坑?

    作者:AI大模型调参指北笔记发布日期:2025-05-12 21:17:00

    在 Python 的 multiprocessing 模块中,隐藏着一个影响深度学习框架性能的关键选择——进程创建方式。让我们通过一个真实的 CUDA 初始化报错案例,深入理解 fork 与 spa

    阅读全文
  • 文章封面

    教娃编程系列|RPG 游戏 – 重力与跳跃

    作者:AI大模型调参指北笔记发布日期:2025-05-09 22:02:12

    由于我们在上一个教程中的努力,我们的玩家角色现在可以移动了。然而,游戏缺乏重力以及与地面本身的交互性。目前,我们的Player只是漂浮在空中,这当然是不可接受的。你可以制作一个临时的解决方案,使用地面

    阅读全文
  • 文章封面

    大模型并行训练的一些知识——极简版

    作者:AI大模型调参指北笔记发布日期:2025-05-08 21:13:56

    Tensor ParallelismTensor parallelism is a technique used to fit a large model in multiple GPUs. For

    阅读全文
  • 文章封面

    GPTQ:生成式预训练Transformer的精确训练后量化

    作者:AI大模型调参指北笔记发布日期:2025-05-07 21:17:00

    生成式预训练的Transformer模型,称为GPT或OPT,通过在复杂语言建模任务中的突破性性能,以及极高的计算和存储成本,使自己脱颖而出。具体来说,由于其庞大的尺寸,即使是对大型,高精度GPT模

    阅读全文
  • 文章封面

    胖东来与京东联手了

    作者:AI大模型调参指北笔记发布日期:2025-05-06 22:55:18

    阅读全文
  • 文章封面

    教娃编程系列|RPG 游戏 – Player Movement

    作者:AI大模型调参指北笔记发布日期:2025-05-05 21:40:26

    Introduction这个Pygame RPG教程和下一个教程都专注于执行移动和物理,允许我们的玩家可以移动,跳跃并与他所站的地面互动的完整系统。本教程的全部内容都是基于我们需要在Player类中创

    阅读全文
  • 文章封面

    这儿没人

    作者:AI大模型调参指北笔记发布日期:2025-05-04 09:17:00

    阅读全文
  • 文章封面

    教娃编程系列|PRG - The Player Class

    作者:AI大模型调参指北笔记发布日期:2025-05-01 21:00:00

    这个RPG教程中最重要的类是Player类。这个类负责几乎所有与玩家相关的事情,包括移动、攻击、碰撞检测、渲染、状态跟踪等等。由于它的总大小和许多概念,我们将在教程系列的其余部分慢慢构建Player类

    阅读全文
  • 文章封面

    LLM 中 tool 和 RAG 怎么融入到对话数据中?

    作者:AI大模型调参指北笔记发布日期:2025-04-30 21:00:00

    在这里插入图片描述整理开源数据的时候,看到一种融入检索 tool 或 RAG 的方式,看着挺简单的,可以供参考:{ "role":"user", "content":"电脑屏幕被

    阅读全文
  • 文章封面

    Qwen3 在五一节前发布了!

    作者:AI大模型调参指北笔记发布日期:2025-04-29 08:50:58

    今天,阿里宣布推出 Qwen3,这是 Qwen 系列大型语言模型的最新成员。我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3

    阅读全文
  • 文章封面

    RLHF 入门,高手勿进!

    作者:AI大模型调参指北笔记发布日期:2025-04-28 21:08:55

    LLM Training: RLHF and Its Alternatives在讨论语言模型(LLM)时,无论是研究新闻还是教程中,我都会频繁提及一种被称为“带有人类反馈的强化学习”(RLHF)的过

    阅读全文
  • 文章封面

    最佳的指令数据应当是什么样的?

    作者:AI大模型调参指北笔记发布日期:2025-04-27 21:00:00

    Abstract高质量的监督微调(SFT)数据对于激发预训练大型语言模型(LLM)的强大能力至关重要。通常情况下,指令会与从其他 LLM 中采样的多个响应配对,而这些响应往往偏离了要微调的目标模型的

    阅读全文
上一页下一页