Qwen3新成员:Embedding系列模型登场!
今天,我们正式发布Qwen3-Embedding系列模型, Qwen模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计,基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能
阅读全文今天,我们正式发布Qwen3-Embedding系列模型, Qwen模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计,基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能
阅读全文Scaling Law最早在语言建模当中被发现,在下一个词预测任务当中,研究者们发现测试损失随着训练规模和模型规模的指数增长而线性下降。这一发现迄今促成了一系列强大的语言模型,他们对人类语言和知识展现
阅读全文提升大模型智能水平,通常有两条主流的Scaling Law(扩展定律)路线:一是扩展参数(Parameter Scaling),用更多模型参数来更细致地学习,进而提升性能;二是扩展推理思考的时间(In
阅读全文Qwen3系列模型拥有卓越的Agent能力。然而,从模型到Agent,开发者们仍存在许多技术及工程适配等难题。今天,我们推出3个基于Qwen-Agent框架的CookBook,演示如何通过这一框架让Q
阅读全文不久前,我们开源了通义千问Qwen3系列模型;今天,我们正式发布Qwen3的技术报告。在这份Qwen3技术报告中,你可以深入了解到Qwen3模型架构、预训练及后训练过程、模型性能表现等诸多此前尚未公布
阅读全文面对海量信息和高强度的任务压力,系统地研究一件事变得费时且难以聚焦。你可能想找个靠谱的「助手」,帮你梳理复杂问题,快速理清头绪,甚至直接生成一份条理清晰、数据可信的研究报告。现在,它来了。Deep R
阅读全文今天,我们宣布推出 Qwen3,这是 Qwen 系列大型语言模型的最新成员。我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-
阅读全文向大家分享一个好消息。近期,中国科学院国家天文台、中国科学院青藏高原研究所、中国科学院南海海洋研究所等多个科研项目相继接入阿里通义千问开源模型 QwQ-32B。点击卡片 了解QwQ-32B青藏高原孕育
阅读全文去年12月,我们推出了 QVQ-72B-Preview, 作为一个探索模型,它存在一些不足之处。今天,我们正式推出 QVQ-Max 视觉推理模型的第一版。这一新版本的模型具备强大的多模态处理能力,它不
阅读全文今天,我们发布了 Qwen2.5-Omni,Qwen 模型家族中新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成
阅读全文今年一月底,我们推出了 Qwen2.5-VL 系列模型,获得了社区的广泛关注和积极反馈。在 Qwen2.5-VL 系列的基础上,我们使用强化学习持续优化模型,并使用 Apache 2.0 协议开源 3
阅读全文前不久,我们发布了推理模型通义千问QwQ-32B,在 LiveBench 榜单上取得了开源模型的最佳成绩。在针对模型的 Agent 能力的 BFCL 评测中,千问 QwQ-32B 模型在工具调用准确率
阅读全文近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。这一次,我们探讨了大规模强化学习(
阅读全文