全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十六

    作者:AI大模型调参指北笔记发布日期:2026-05-13 21:00:00

    ammo.pytry: import ammo.torch.quantization as atq from ammo.torch.export import export_model_

    阅读全文
  • 文章封面

    flashinfer.sampling 实现二

    作者:AI大模型调参指北笔记发布日期:2026-05-12 21:00:00

    bench_sampling# https://github.com/flashinfer-ai/flashinfer/blob/48966b603ebabcd003f7272e8dc161ce05

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十四

    作者:AI大模型调参指北笔记发布日期:2026-05-11 21:00:00

    LLaMADecoderLayerclass LLaMADecoderLayer(Module): def __init__(self, layer_id,

    阅读全文
  • 文章封面

    Ruff:打造无错误、高可维护性Python代码的现代化代码检查工具

    作者:AI大模型调参指北笔记发布日期:2026-05-10 22:00:00

    在这里插入图片描述代码检查是编写整洁、可读且可共享代码的关键环节。Ruff这类代码检查工具能分析代码,排查语法错误、风格问题和可疑的代码结构。在提交并共享代码前,通过代码检查可以提前解决问题,提升代

    阅读全文
  • 文章封面

    HF 和 TRT-LLM multinomial 采样解码实现一

    作者:AI大模型调参指北笔记发布日期:2026-05-09 21:00:00

    HF logits_procssGenerationConfigclass GenerationConfig(PushToHubMixin): # no-format """ Cl

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十四

    作者:AI大模型调参指北笔记发布日期:2026-05-08 22:00:00

    LLaMADecoderLayerclass LLaMADecoderLayer(Module): def __init__(self, layer_id,

    阅读全文
  • 文章封面

    什么是氛围编程(Vibe Coding)?

    作者:AI大模型调参指北笔记发布日期:2026-05-02 21:00:00

    定义氛围编程是一种新兴的软件开发模式:开发者借助人工智能(AI),通过自然语言提示生成可运行代码,大幅提升开发效率,同时降低编程门槛,尤其适合编程基础薄弱的人群快速搭建应用。该概念由AI研究者安德烈

    阅读全文
  • 文章封面

    入门MPI必看!一文搞懂分布式并行编程的核心基础

    作者:AI大模型调参指北笔记发布日期:2026-04-29 21:00:00

    分布式计算早就不是什么“高冷技术”了——它就像我们每天用的手机、电脑一样普及,而你能刷到这篇MPI教程,本身就说明你已经走在了并行编程的路上。不管你是为了课程作业、工作需求,还是单纯对并行/分布式

    阅读全文
  • 文章封面

    MPI Hello World 教程:从代码解析到运行实操

    作者:AI大模型调参指北笔记发布日期:2026-04-29 21:00:00

    这节课将通过一个基础的 MPI Hello World 程序,带大家掌握 MPI 程序的基本结构,同时详细讲解如何编译、运行 MPI 程序,核心涵盖 MPI 环境初始化、进程管理等基础知识点,帮大

    阅读全文
  • 文章封面

    MPI 组与通讯器详解

    作者:AI大模型调参指北笔记发布日期:2026-04-29 21:00:00

    在之前的教程中,我们一直使用默认通讯器 MPI_COMM_WORLD。对于简单程序而言,这已经足够满足需求——毕竟这类程序的进程数量较少,通信场景也相对简单,通常只需与单个进程对话,或与所有进程同

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十三

    作者:AI大模型调参指北笔记发布日期:2026-04-27 21:00:00

    QuantModefrom enum import IntFlag, auto 这行代码让你能够创建支持位运算(如按位或 |、按位与 &)的枚举类型,并能自动为成员分配值。这在管理一组可以组合使用的

    阅读全文
  • 文章封面

    BS::thread_pool 一个快速、轻量级、现代且易于使用的线程池库

    作者:AI大模型调参指北笔记发布日期:2026-04-25 21:00:00

    IntroductionMotivation多线程技术对于现代高性能计算至关重要。自 C11 版本以来,C 标准库就引入了使用诸如 std::thread 这样的构造函数来实现内置的底层多线程支持。

    阅读全文
  • 文章封面

    MiMo-V2-Flash技术报告

    作者:AI大模型调参指北笔记发布日期:2026-04-24 21:00:00

    摘要本文提出MiMo-V2-Flash,一款总参数量3090亿、激活参数量150亿的混合专家(MoE)大语言模型,专为高效强推理与智能体能力设计。该模型采用滑动窗口注意力(SWA)与全局注意力交替的

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十二

    作者:AI大模型调参指北笔记发布日期:2026-04-23 21:00:00

    attention.pyclass RotaryScalingType(IntEnum): none = 0 linear = 1 dynamic = 2class Positio

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十一

    作者:AI大模型调参指北笔记发布日期:2026-04-22 21:00:00

    mlp.py在这里插入图片描述MLPclass MLP(Module): def __init__(self, hidden_size,

    阅读全文
  • 文章封面

    AI原生开发中的MCP与CLI对比

    作者:AI大模型调参指北笔记发布日期:2026-04-20 21:00:00

    摘要CLI与MCP的选择,本质取决于你处于开发流程的哪个环节。CLI适配开发内循环:快速、本地、零开销。MCP服务适配开发外循环:对接外部系统、共享基础设施、提供结构化访问。绝大多数团队需要两者结合

    阅读全文
  • 文章封面

    T&& 万能引用

    作者:AI大模型调参指北笔记发布日期:2026-04-18 21:00:00

    在 C 模板中,`&&` 的行为与普通右值引用不同,它被称为 **万能引用(Universal Reference)** 或 **转发引用(Forwarding Reference)**。其核心特性

    阅读全文
  • 文章封面

    flashinfer.sampling 实现一

    作者:AI大模型调参指北笔记发布日期:2026-04-17 21:00:00

    jit.sampling# jit/env.py_package_root: pathlib.Path = pathlib.Path(__file__).resolve().parents[1]FL

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十

    作者:AI大模型调参指北笔记发布日期:2026-04-15 21:00:00

    linear.pydef _gemm_plugin(input: Tensor, mat2: Tensor, transa: bool

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之九

    作者:AI大模型调参指北笔记发布日期:2026-04-14 21:00:00

    embedding.pyclass Embedding(Module): """ The embedding layer takes input indices (x) and the

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之八

    作者:AI大模型调参指北笔记发布日期:2026-04-13 21:00:00

    activation.pyclass Mish(Module): def forward(self, input): return input * tanh(softplus(i

    阅读全文
  • 文章封面

    C++ 中 ... 符号

    作者:AI大模型调参指北笔记发布日期:2026-04-12 21:00:00

    在 C 模板语法中,`template` 中的 `...` 是 **参数包展开运算符**,用于声明**可变参数模板**(Variadic Template)。它的核心作用是让模板能够接受**任意数量

    阅读全文
  • 文章封面

    Qwen3-TTS 技术报告

    作者:AI大模型调参指北笔记发布日期:2026-04-11 21:00:00

    摘要本报告提出Qwen3-TTS 系列模型,这是一套先进的多语言、可控制、高鲁棒、流式文本转语音模型家族。Qwen3-TTS 支持当前最优的 3 秒语音克隆与基于文本描述的语音控制,既可生成全新音色

    阅读全文
  • 文章封面

    Vibe Coding 氛围编程最佳实践

    作者:AI大模型调参指北笔记发布日期:2026-04-10 21:00:00

    Vibe Coding 核心是依托氛围进入心流,以创意、快速迭代为目标,常结合AI辅助完成原型开发、创意编程,区别于传统严谨工程化开发,以下是完整最佳实践:一、核心原则1. 先跑通逻辑,再追求规范

    阅读全文
  • 文章封面

    Paged Attention, IFB, and Request Scheduling

    作者:AI大模型调参指北笔记发布日期:2026-04-09 21:00:00

    In-flight BatchingTensorRT LLM 支持请求的在途批量处理(也称为连续批量处理或迭代级别批量处理),以提高服务吞吐量。通过此功能,上下文阶段的序列可以与生成阶段的序列一起进

    阅读全文
  • 文章封面

    VoxCPM 模型结构

    作者:AI大模型调参指北笔记发布日期:2026-04-07 21:09:00

    Audio VAEclass AudioVAE(nn.Module): """ Args: """ def __init__( self, enc

    阅读全文
  • 文章封面

    理解 VoxCPM 模型

    作者:AI大模型调参指北笔记发布日期:2026-04-06 21:00:00

    在这里插入图片描述这是 VoxCPM,一款由 OpenBMB 推出的无分词器(Tokenizer-Free)端到端文本转语音(TTS)模型。它通过分层语言建模和扩散自回归架构,直接生成连续的语音表示

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之七

    作者:AI大模型调参指北笔记发布日期:2026-04-03 21:00:00

    graph_rewriting.pyLayerclass Layer: ''' Layer is a wrapper for TensorRT's ILayer with several

    阅读全文
  • 文章封面

    Claude Code 源码泄露:伪造工具、挫败感正则、卧底模式及更多

    作者:AI大模型调参指北笔记发布日期:2026-04-02 21:00:00

    Anthropic 在其 npm 包中意外附带了源映射文件,导致 Claude Code 完整源码暴露。本文带你深挖其中的核心细节。以当邵超凡(Chaofan Shou)今早发现,Anthropic

    阅读全文
  • 文章封面

    Claude Code代码泄露事件-愚人节前的礼物

    作者:AI大模型调参指北笔记发布日期:2026-04-01 21:00:00

    事件核心概览2026年3月31日(愚人节前夜),Anthropic旗下AI编程工具Claude Code的完整源代码意外泄露,起因是npm包发布时的配置失误,而非黑客攻击。安全研究员Chaofan

    阅读全文
下一页