梁文锋、杨植麟同一天发论文“秀肌肉”,主题居然撞上了!下一代模型要来了?
整理|冬梅 2 月 18 日,DeepSeek 和月之暗面(Moonshot AI)几乎在同一时间发布了各自最新的研究成果,巧合的是,两篇论文的主题高度一致——都聚焦于改进 Transformer 架
阅读全文整理|冬梅 2 月 18 日,DeepSeek 和月之暗面(Moonshot AI)几乎在同一时间发布了各自最新的研究成果,巧合的是,两篇论文的主题高度一致——都聚焦于改进 Transformer 架
阅读全文作者 | Denys Linkov 译者 | 马可薇 策划 | Tina 摘要AI 领域的每个应用场景都有其独到的挑战。在系统承载了生产环境的流量后,开发者就需要开始监控边界场景和特
阅读全文作者 | 褚杏娟 2 月 18 日,DeepSeek 发布了一篇新论文,提出了一种新的注意力机制——NSA。值得注意的是,创始人梁文锋参与编写并亲自上传了该论文。根据论文介绍,DeepSeek 团队
阅读全文作者 | 冬梅 2025 年 2 月 18 日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中,包含 目前全球范围内参数量最大、性能最好的开源视
阅读全文