社区供稿丨感知无界·创造有形:百灵全模态 Ming-flash-omni-2.0 焕新生活想象
马年将至,百灵 Ming-flash-omni-2.0 正式焕新登场!在这个辞旧迎新的时刻,让我们先请出 Ming-flash-omni-2.0 为大家送上一份特别的“马年祝福”!Ming-flash
阅读全文马年将至,百灵 Ming-flash-omni-2.0 正式焕新登场!在这个辞旧迎新的时刻,让我们先请出 Ming-flash-omni-2.0 为大家送上一份特别的“马年祝福”!Ming-flash
阅读全文今天,我们开源了新一代全模态旗舰模型 MiniCPM-o 4.5 !作为原生全双工的全模态大模型,MiniCPM-o 4.5 让人机交互再上新台阶——通过「边看、边听、主动说」的全模态能力,让 AI
阅读全文2月4日,上海人工智能实验室开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型 Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0
阅读全文这是关于中国开源社区自 2025 年 1 月 “DeepSeek 时刻” 以来历史性进展的三篇系列博客中的第三篇,也是最后一篇。第一篇“DeepSeek 时刻” 一周年; 第二篇DeepSeek之后:
阅读全文这是系列博客中的第二篇。我们将继续聚焦于自 2025 年 1 月 “DeepSeek 时刻” 以来中国开源社区所取得的历史性进展。(第一篇博客见:“DeepSeek 时刻” 一周年 )在本篇中,我们将
阅读全文大语言模型 (LLM) 已成为构建现代软件不可或缺的工具。 但对于 Apple 平台的开发者来说,集成这些模型仍然不够友好。在开发 AI 驱动的应用时,开发者通常采用混合方案,比如:使用 Core M
阅读全文简介自定义内核是高性能深度学习的基础,它让 GPU 操作能完全贴合你的工作负载需求——无论是图像处理、张量变换,还是其他计算密集型任务。然而,要为正确的架构编译这些内核、配置各种编译标志并干净地整合到
阅读全文在深度研究(DeepResearch)席卷而来的今天,我们都渴望拥有一位可以综合复杂信息、自动撰写万字长文的个人专属“超级写作助手”。但当你手握公司明年的战略规划、未公开的财务报表,或是涉及核心机密的
阅读全文这是一个系列文章中的第一篇。在这篇文章中,我们将回顾过去一年中国开源 AI 社区发生的历史性转折,并分析这些变化如何重塑整个全球开源生态系统。许多 2025 年的重要进展,都可以追溯到一个起点:202
阅读全文过去一年,大模型推理能力的进化几乎沿着一条单向路径前进:更复杂的推理过程、更长的思维链、更“像人类”的自我反思。更复杂的推理过程、更长的思维链、更“像人类”的自我反思。在数学和科学推理等benchma
阅读全文当全行业还在争论 30B 能否挑战万亿参数时,我们给出了一个更激进的答案: 4B。没有万亿参数的算力堆砌,没有百万级数据的暴力灌入,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB
阅读全文Transformers v5对分词器的工作方式进行了全新设计。分词器的重构将分词器的结构设计与训练好的词表分离 (就像 PyTorch 将神经网络结构与训练权重分离一样) 。结果就是:现在的分词器更
阅读全文CES 2026 的现场,未来已来。在刚刚结束的NVIDIA CES 2026主题演讲中,NVIDIA 发布了一系列全新的开放模型,包括Nemotron推理大模型、Isaac GR00T N1.6开
阅读全文摘要一篇实用指南,手把手教你如何采集数据、训练策略,并将自动化医疗机器人工作流程部署到真实硬件上。简介仿真一直是医学影像中弥补数据缺口的重要手段,但在医疗机器人领域,它过去往往速度太慢、系统割裂,或难
阅读全文banner继我们使用Claude Code训练开源模型的项目之后,现在我们更进一步,将Codex引入这一流程。这里的重点不是“Codex 自己开源模型”,而是让 Codex 作为编码代理,参与并自动
阅读全文本文整理自蚂蚁集团资深算法专家陈景东在 Hugging Face Papers 直播 AI Insight Talk| Omni 全模态专场的分享。引言:百灵大模型的整体战略布局自推出以来,蚂蚁百灵多
阅读全文快速了解 (TLDR)现在只需一行代码,就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集,无需下载!无需复杂配置、不占磁盘空间、不再担心
阅读全文近年来,大语言模型(LLM)的发展仿佛陷入了一场“参数军备竞赛”:参数规模从百亿、千亿,一路飙升至万亿级别。模型规模不断膨胀,效果虽有所提升,但推理成本与微调训练成本也水涨船高,让众多企业与开发者望而
阅读全文今天我们正式发布 Jina-VLM,这是一款 2.4B 参数量的视觉语言模型(VLM),在同等规模下达到了多语言视觉问答(Multilingual VQA)任务上的 SOTA 基准。面对小参数量 VL
阅读全文简要总结: 经过五年的持续开发,huggingface_hub 发布 v1.0 正式版!这一里程碑标志着这个库的成熟与稳定。它已成为 Python 生态中支撑 20 万个依赖库 的核心组件,并提供访问
阅读全文在飞速变化的研究世界中,紧跟最新进展至关重要。为帮助开发者与研究人员把握人工智能前沿动态,我们推出了 Hugging Face 论文页面。自上线以来,Daily Papers 已收录超过 1 万篇由
阅读全文https://huggingface.co/collections/AI-Insight/hf-papers-live-6-ocr由 Hugging Face × OpenMMLab × Model
阅读全文我们在这篇文章中新增了 Chandra 和 OlmOCR-2,并附上了它们在 OlmOCR 基准上的得分 🫡Chandrahttps://hf.co/datalab-to/chandraOlmOCR-
阅读全文🧭简要概览:Hugging Face AI Sheets 是一款开源工具,能够用 AI 模型增强数据集的处理能力,无需编写任何代码。现在新增视觉功能:可以从图像 (如收据、文档) 中提取数据、根据文本
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明
阅读全文今年的1024程序员节,小红书@REDacademy和@科技薯办了一场直播。小红书技术副总裁凯奇、小红书语音模型技术负责人风龙,携手Hugging Face联合创始人Thomas Wolf,以AMA(
阅读全文我们非常高兴地宣布,LeRobot 迎来一系列重大升级,让开源的机器人学习比以往更强大、更可扩展、也更易用!从重构的数据集到灵活的编辑工具、新的仿真环境,以及面向硬件的全新插件系统,LeRobot 正
阅读全文近日,全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试——RoboChallenge重磅推出;通过科学的评估体系构建一个开放、公正、可复现的「真实考场」,克服真实环境下的性能
阅读全文