全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    聊聊MoA(混合智能体架构):如何激发LLM潜力并掀起语言模型协作革命?

    作者:机智流发布日期:2025-05-12 22:01:07

    全文约 3500 字,预计阅读时间约 9 分钟近年来,大型语言模型(LLMs)在自然语言处理领域掀起了一场风暴,从对话生成到复杂任务推理,它们的表现令人惊叹。然而,单个模型的性能总有瓶颈,训练成本高

    阅读全文
  • 文章封面

    一起聊聊Nvidia Blackwell 新特性之UMMA

    作者:机智流发布日期:2025-05-11 22:28:36

    作者:企鹅火烈鸟原文链接:https://research.colfax-intl.com/cutlass-tutorial-writing-gemm-kernels-using-tensor-mem

    阅读全文
  • 文章封面

    跨网页解析实战:基于LangChain的多段文本分析与结构化抽取

    作者:机智流发布日期:2025-05-10 22:25:16

    作者:李剑锋前言继上节课我们学习了如何利用 Function Calling 完成文本标注和信息抽取任务后,本节课将围绕“从真实网页中提取结构化信息”的主题展开一次完整实战。课程分为以下三个模块:模块

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 APT-Serve:提升有效吞吐量 8.8 倍背后的混合缓存机制和自适应请求调度算法

    作者:机智流发布日期:2025-05-09 23:14:23

    全文约 2100 字,预计阅读时间 6 分钟在大语言模型(LLM)推理服务需求激增的背景下,如何高效处理海量请求、保障服务质量成为行业焦点。就在上个月,来自港科大与上海交大的研究团队提出了全新框架——

    阅读全文
  • 文章封面

    速报:扣子空间开放测试,无需邀请码|阿里开源大模型搜索引擎|腾讯开源 HunyuanCustom

    作者:机智流发布日期:2025-05-09 23:14:23

    作者:yanbo新闻资讯1. 扣子空间开放测试,无需邀请码即可体验专家 Agent 服务近日,扣子空间正式宣布开放测试,无需邀请码即可登录官网体验产品。此次测试开放了三大专家 Agent,包括:用户研

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 MuxServe:多LLM并发服务如何实现1.8倍吞吐量提升?

    作者:机智流发布日期:2025-05-08 22:30:00

    全文约 2000 字,预计阅读时间 6 分钟在大语言模型(LLM)席卷AI行业的今天,如何高效地为多个LLM提供服务成为了一个亟待解决的问题。一篇题为《MuxServe: Flexible Spati

    阅读全文
  • 文章封面

    LTX新开源13B模型生成提速30倍,5090跑出好莱坞特效

    作者:机智流发布日期:2025-05-08 22:30:00

    本文转载自量子位,作者:量子位梦晨 鹭羽最新开源模型LTXV-13B,免费可商用、推理速度快、游戏显卡就能跑,视觉效果也不错。要素都齐了,想不火都难。从官方透露的信息看,新模型在速度、质量和控制三个方

    阅读全文
上一页