通义千问Qwen

Qwen3新成员：Embedding系列模型登场！
作者：通义千问Qwen发布日期：2025-06-06 00:11:02
今天，我们正式发布Qwen3-Embedding系列模型, Qwen模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计，基于Qwen3基础模型进行训练，充分继承了Qwen3在多语言文本理解能
阅读全文
建模世界偏好：偏好建模中的Scaling Laws
作者：通义千问Qwen发布日期：2025-05-21 14:02:43
Scaling Law最早在语言建模当中被发现，在下一个词预测任务当中，研究者们发现测试损失随着训练规模和模型规模的指数增长而线性下降。这一发现迄今促成了一系列强大的语言模型，他们对人类语言和知识展现
阅读全文
ParScale：一种全新的大模型Scaling Law
作者：通义千问Qwen发布日期：2025-05-20 13:00:00
提升大模型智能水平，通常有两条主流的Scaling Law（扩展定律）路线：一是扩展参数（Parameter Scaling），用更多模型参数来更细致地学习，进而提升性能；二是扩展推理思考的时间（In
阅读全文
🎉全球开源模型榜冠军+1+1+1
作者：通义千问Qwen发布日期：2025-05-19 12:00:00
阅读全文
解锁 Qwen3 的Agent能力，CookBook来咯！
作者：通义千问Qwen发布日期：2025-05-16 18:13:14
Qwen3系列模型拥有卓越的Agent能力。然而，从模型到Agent，开发者们仍存在许多技术及工程适配等难题。今天，我们推出3个基于Qwen-Agent框架的CookBook，演示如何通过这一框架让Q
阅读全文
Qwen3技术报告首次全公开！“混合推理模型”是这样炼成的
作者：通义千问Qwen发布日期：2025-05-14 17:49:32
不久前，我们开源了通义千问Qwen3系列模型；今天，我们正式发布Qwen3的技术报告。在这份Qwen3技术报告中，你可以深入了解到Qwen3模型架构、预训练及后训练过程、模型性能表现等诸多此前尚未公布
阅读全文
上新！让Qwen帮你「深入研究」一下吧！
作者：通义千问Qwen发布日期：2025-05-13 21:58:38
面对海量信息和高强度的任务压力，系统地研究一件事变得费时且难以聚焦。你可能想找个靠谱的「助手」，帮你梳理复杂问题，快速理清头绪，甚至直接生成一份条理清晰、数据可信的研究报告。现在，它来了。Deep R
阅读全文
QwenChat上线 Web Dev，一句话生成精美网页！
作者：通义千问Qwen发布日期：2025-05-09 21:31:02
阅读全文
开源社区建设，Qwen与大家一起努力🫶
作者：通义千问Qwen发布日期：2025-05-08 16:35:08
阅读全文
LiveBench放榜：Qwen3斩获全球开源冠军
作者：通义千问Qwen发布日期：2025-05-06 20:35:40
阅读全文
尺寸更小，性能依旧：Qwen2.5-Omni-3B 登场！
作者：通义千问Qwen发布日期：2025-05-01 11:14:40
阅读全文
Qwen3：思深，行速
作者：通义千问Qwen发布日期：2025-04-29 05:25:25
今天，我们宣布推出 Qwen3，这是 Qwen 系列大型语言模型的最新成员。我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-
阅读全文
AI Researchers：Qwen在ICLR现场等你
作者：通义千问Qwen发布日期：2025-04-22 18:46:32
阅读全文
实战来了！QwQ-32B消费级显卡微调全流程
作者：通义千问Qwen发布日期：2025-04-18 16:00:00
阅读全文
又又又拿下一个冠军🏆，全球开源视觉模型第一
作者：通义千问Qwen发布日期：2025-04-11 17:46:27
阅读全文
Qwen2.5-Omni-7B 荣登全球开源趋势榜🎉
作者：通义千问Qwen发布日期：2025-04-02 18:30:00
阅读全文
当大模型来到科研前线：青年科学家眼中的 QwQ-32B
作者：通义千问Qwen发布日期：2025-03-31 17:30:00
向大家分享一个好消息。近期，中国科学院国家天文台、中国科学院青藏高原研究所、中国科学院南海海洋研究所等多个科研项目相继接入阿里通义千问开源模型 QwQ-32B。点击卡片了解QwQ-32B青藏高原孕育
阅读全文
视觉理解QVQ-Max: 有眼力，更有脑力
作者：通义千问Qwen发布日期：2025-03-28 13:02:33
去年12月，我们推出了 QVQ-72B-Preview, 作为一个探索模型，它存在一些不足之处。今天，我们正式推出 QVQ-Max 视觉推理模型的第一版。这一新版本的模型具备强大的多模态处理能力，它不
阅读全文
Qwen2.5-Omni：看，听，说，写，样样精通！
作者：通义千问Qwen发布日期：2025-03-27 02:32:49
今天，我们发布了 Qwen2.5-Omni，Qwen 模型家族中新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成
阅读全文
通义千问Qwen上车啦！
作者：通义千问Qwen发布日期：2025-03-26 13:25:29
阅读全文
支持本地部署，更聪明的视觉理解大模型来咯！
作者：通义千问Qwen发布日期：2025-03-25 13:03:44
今年一月底，我们推出了 Qwen2.5-VL 系列模型，获得了社区的广泛关注和积极反馈。在 Qwen2.5-VL 系列的基础上，我们使用强化学习持续优化模型，并使用 Apache 2.0 协议开源 3
阅读全文
仅需2步，解锁 QwQ-32B 的 Function Call 超能力
作者：通义千问Qwen发布日期：2025-03-21 21:25:13
前不久，我们发布了推理模型通义千问QwQ-32B，在 LiveBench 榜单上取得了开源模型的最佳成绩。在针对模型的 Agent 能力的 BFCL 评测中，千问 QwQ-32B 模型在工具调用准确率
阅读全文
「族谱」奉上！通义千问模型命名规则大揭秘
作者：通义千问Qwen发布日期：2025-03-19 19:04:56
阅读全文
LiveBench放榜：QwQ-32B创开源模型新高🏆
作者：通义千问Qwen发布日期：2025-03-17 15:30:00
阅读全文
QwQ-32B：更小尺寸，性能比肩全球最强开源推理模型
作者：通义千问Qwen发布日期：2025-03-06 03:30:16
近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1 通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。这一次，我们探讨了大规模强化学习（
阅读全文