全部
安全
开发
新闻
数码
摄影
汽车
北京
AI
IT
其他
LiveBench放榜:QwQ-32B创开源模型新高🏆
作者:
通义千问Qwen
发布日期:2025-03-17 15:30:00
阅读全文
QwQ-32B:更小尺寸,性能比肩全球最强开源推理模型
作者:
通义千问Qwen
发布日期:2025-03-06 03:30:16
近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。这一次,我们探讨了大规模强化学习(
阅读全文
上一页