全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    LiveBench放榜:QwQ-32B创开源模型新高🏆

    作者:通义千问Qwen发布日期:2025-03-17 15:30:00

    阅读全文
  • 文章封面

    QwQ-32B:更小尺寸,性能比肩全球最强开源推理模型

    作者:通义千问Qwen发布日期:2025-03-06 03:30:16

    近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。这一次,我们探讨了大规模强化学习(

    阅读全文
上一页