Hugging Face

社区发布丨全面开源！商汤日日新SenseNova U1发布，迈向模型理解生成统一时代
作者：Hugging Face发布日期：2026-04-29 11:00:00
今天，我们正式发布并开源商汤日日新SenseNova U1 系列原生理解生成统一模型。它基于商汤于今年三月份自主研发的 NEO-unify架构，在单一模型架构上统一了多模态理解、推理与生成。NEO-u
阅读全文
社区供稿丨无需编解码器，NEO-unify如何打造原生视觉语言理解与生成
作者：Hugging Face发布日期：2026-04-03 11:00:00
今天，商汤科技发布一篇最新技术博客 NEO-unify: 原生架构打造端到端多模态理解与生成统一模型（NEO-unify: Building Native Multimodal Unified Mod
阅读全文
Transformer 中的专家混合模型 (MoE)
作者：Hugging Face发布日期：2026-03-27 08:50:18
引言在过去几年里，大规模稠密语言模型的扩展推动了大语言模型 (LLMs) 的主要进展。从早期的模型，比如最初的ULMFiT(约 3000 万参数) 或 GPT-2 (15 亿参数，当时甚至被认为“过于
阅读全文
在 Hugging Face Hub 上引入 Storage Buckets
作者：Hugging Face发布日期：2026-03-21 10:00:00
Hugging Face 的 Models 和 Datasets 仓库非常适合用来发布最终产物。但在生产级机器学习流程中，会持续产生大量中间文件 (如 checkpoints、optimizer st
阅读全文
LeRobot v0.5.0 正式发布
作者：Hugging Face发布日期：2026-03-11 09:23:29
自 v0.4.0 以来，项目已经合并了 200+ 个 PR，并迎来了 50 多位新贡献者。因此 LeRobot v0.5.0 成为目前规模最大的一次发布 —— 几乎在所有方向上都实现了扩展：支持更多机
阅读全文
社区供稿丨Ling-2.5-1T，普惠智能，即时响应
作者：Hugging Face发布日期：2026-02-16 20:10:00
今天，我们发布并开源 Ling-2.5-1T。深度思考模型（thinking model）拉升智能上限，即时模型（instant model）则凭效率与效果的平衡拓宽智能覆盖，它让 AGI 不只更强，
阅读全文
社区供稿丨Ring-2.5-1T，思更深，行更远
作者：Hugging Face发布日期：2026-02-13 18:30:00
今天，我们发布并开源首个混合线性架构的万亿参数思考模型 Ring-2.5-1T。作为迈向通用智能体时代的关键步骤，我们将混合线性注意力架构在预训练和强化学习上均进行了大规模扩展，一方面利用高效的 1：
阅读全文
社区供稿丨感知无界·创造有形：百灵全模态 Ming-flash-omni-2.0 焕新生活想象
作者：Hugging Face发布日期：2026-02-11 21:01:00
马年将至，百灵 Ming-flash-omni-2.0 正式焕新登场！在这个辞旧迎新的时刻，让我们先请出 Ming-flash-omni-2.0 为大家送上一份特别的“马年祝福”！Ming-flash
阅读全文
社区供稿丨MiniCPM-o 4.5开源：「眼耳口」并用，模型交互从「一问一答」变为「即时自由对话」
作者：Hugging Face发布日期：2026-02-06 12:00:00
今天，我们开源了新一代全模态旗舰模型 MiniCPM-o 4.5 ！作为原生全双工的全模态大模型，MiniCPM-o 4.5 让人机交互再上新台阶——通过「边看、边听、主动说」的全模态能力，让 AI
阅读全文
社区供稿丨迈向AI4S 2.0，上海AI实验室开源书生万亿科学大模型Intern-S1-Pro
作者：Hugging Face发布日期：2026-02-05 12:00:00
2月4日，上海人工智能实验室开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型 Intern-S1-Pro，为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0
阅读全文
全球开源 AI 生态的未来：从 DeepSeek 到 AI+
作者：Hugging Face发布日期：2026-02-04 10:00:00
这是关于中国开源社区自 2025 年 1 月 “DeepSeek 时刻” 以来历史性进展的三篇系列博客中的第三篇，也是最后一篇。第一篇“DeepSeek 时刻” 一周年; 第二篇DeepSeek之后：
阅读全文
DeepSeek之后：中国开源人工智能生态的架构选择
作者：Hugging Face发布日期：2026-01-28 22:30:00
这是系列博客中的第二篇。我们将继续聚焦于自 2025 年 1 月 “DeepSeek 时刻” 以来中国开源社区所取得的历史性进展。（第一篇博客见：“DeepSeek 时刻” 一周年）在本篇中，我们将
阅读全文
推出 AnyLanguageModel：在 Apple 平台统一本地与远程大语言模型的 API
作者：Hugging Face发布日期：2026-01-27 11:10:00
大语言模型 (LLM) 已成为构建现代软件不可或缺的工具。但对于 Apple 平台的开发者来说，集成这些模型仍然不够友好。在开发 AI 驱动的应用时，开发者通常采用混合方案，比如：使用 Core M
阅读全文
使用 Hugging Face 轻松构建并共享 ROCm 内核
作者：Hugging Face发布日期：2026-01-26 11:09:09
简介自定义内核是高性能深度学习的基础，它让 GPU 操作能完全贴合你的工作负载需求——无论是图像处理、张量变换，还是其他计算密集型任务。然而，要为正确的架构编译这些内核、配置各种编译标志并干净地整合到
阅读全文
社区供稿丨DeepResearch 终于本地化了！8B端侧写作智能体AgentCPM-Report开源！
作者：Hugging Face发布日期：2026-01-22 10:00:00
在深度研究（DeepResearch）席卷而来的今天，我们都渴望拥有一位可以综合复杂信息、自动撰写万字长文的个人专属“超级写作助手”。但当你手握公司明年的战略规划、未公开的财务报表，或是涉及核心机密的
阅读全文
“DeepSeek 时刻” 一周年
作者：Hugging Face发布日期：2026-01-21 10:00:00
这是一个系列文章中的第一篇。在这篇文章中，我们将回顾过去一年中国开源 AI 社区发生的历史性转折，并分析这些变化如何重塑整个全球开源生态系统。许多 2025 年的重要进展，都可以追溯到一个起点：202
阅读全文
社区供稿丨如何抑制大模型的“过度反思”：Yuan3.0 Flash 中的强化学习范式
作者：Hugging Face发布日期：2026-01-15 11:00:00
过去一年，大模型推理能力的进化几乎沿着一条单向路径前进：更复杂的推理过程、更长的思维链、更“像人类”的自我反思。更复杂的推理过程、更长的思维链、更“像人类”的自我反思。在数学和科学推理等benchma
阅读全文
社区供稿丨AgentCPM-Explore开源，4B 参数突破端侧智能体模型性能壁垒
作者：Hugging Face发布日期：2026-01-14 11:00:00
当全行业还在争论 30B 能否挑战万亿参数时，我们给出了一个更激进的答案： 4B。没有万亿参数的算力堆砌，没有百万级数据的暴力灌入，清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB
阅读全文
Transformers v5 中的分词系统：更简洁、更清晰、更模块化
作者：Hugging Face发布日期：2026-01-13 11:10:00
Transformers v5对分词器的工作方式进行了全新设计。分词器的重构将分词器的结构设计与训练好的词表分离 (就像 PyTorch 将神经网络结构与训练权重分离一样) 。结果就是：现在的分词器更
阅读全文
社区供稿丨Reachy Mini 亮相 CES 黄仁勋主题演讲：一场开源共创的科技旅程
作者：Hugging Face发布日期：2026-01-06 22:20:00
CES 2026 的现场，未来已来。在刚刚结束的NVIDIA CES 2026主题演讲中，NVIDIA 发布了一系列全新的开放模型，包括Nemotron推理大模型、Isaac GR00T N1.6开
阅读全文
使用 NVIDIA Isaac 构建医疗机器人：从仿真到部署
作者：Hugging Face发布日期：2025-12-25 11:25:32
摘要一篇实用指南，手把手教你如何采集数据、训练策略，并将自动化医疗机器人工作流程部署到真实硬件上。简介仿真一直是医学影像中弥补数据缺口的重要手段，但在医疗机器人领域，它过去往往速度太慢、系统割裂，或难
阅读全文
Codex 正在推动开源 AI 模型的训练与发布
作者：Hugging Face发布日期：2025-12-20 11:00:00
banner继我们使用Claude Code训练开源模型的项目之后，现在我们更进一步，将Codex引入这一流程。这里的重点不是“Codex 自己开源模型”，而是让 Codex 作为编码代理，参与并自动
阅读全文
社区供稿丨Ming-Omni：百灵多模态实践与探索
作者：Hugging Face发布日期：2025-12-18 12:51:18
本文整理自蚂蚁集团资深算法专家陈景东在 Hugging Face Papers 直播 AI Insight Talk｜ Omni 全模态专场的分享。引言：百灵大模型的整体战略布局自推出以来，蚂蚁百灵多
阅读全文
流式数据集：效率提升 100 倍！
作者：Hugging Face发布日期：2025-12-17 11:51:48
快速了解 (TLDR)现在只需一行代码，就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集，无需下载！无需复杂配置、不占磁盘空间、不再担心
阅读全文
社区供稿丨以小博大！Nanbeige4-3B重磅开源：硬刚Qwen3，挑战小模型能力新高度
作者：Hugging Face发布日期：2025-12-15 22:00:00
近年来，大语言模型（LLM）的发展仿佛陷入了一场“参数军备竞赛”：参数规模从百亿、千亿，一路飙升至万亿级别。模型规模不断膨胀，效果虽有所提升，但推理成本与微调训练成本也水涨船高，让众多企业与开发者望而
阅读全文
社区供稿丨Jina-VLM：可在笔记本上跑的多语言视觉小模型
作者：Hugging Face发布日期：2025-12-12 18:00:00
今天我们正式发布 Jina-VLM，这是一款 2.4B 参数量的视觉语言模型（VLM），在同等规模下达到了多语言视觉问答（Multilingual VQA）任务上的 SOTA 基准。面对小参数量 VL
阅读全文
huggingface_hub 1.0 正式版现已发布：开源机器学习基础五周年回顾
作者：Hugging Face发布日期：2025-12-11 11:10:00
简要总结：经过五年的持续开发，huggingface_hub 发布 v1.0 正式版！这一里程碑标志着这个库的成熟与稳定。它已成为 Python 生态中支撑 20 万个依赖库的核心组件，并提供访问
阅读全文
Hugging Face 论文页面功能指南
作者：Hugging Face发布日期：2025-12-05 18:30:00
在飞速变化的研究世界中，紧跟最新进展至关重要。为帮助开发者与研究人员把握人工智能前沿动态，我们推出了 Hugging Face 论文页面。自上线以来，Daily Papers 已收录超过 1 万篇由
阅读全文
HF Papers直播 AI Insight Talk | OCR 专场
作者：Hugging Face发布日期：2025-12-03 19:00:00
https://huggingface.co/collections/AI-Insight/hf-papers-live-6-ocr由 Hugging Face × OpenMMLab × Model
阅读全文
用开源模型强化你的 OCR 工作流
作者：Hugging Face发布日期：2025-12-01 13:52:39
我们在这篇文章中新增了 Chandra 和 OlmOCR-2，并附上了它们在 OlmOCR 基准上的得分 🫡Chandrahttps://hf.co/datalab-to/chandraOlmOCR-
阅读全文