ICLR最佳论文:Transformer天生简洁
专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!各种AI能完成各种任务,我们见得多了。但它是怎么想的?它的内部构造是笨拙臃肿
阅读全文专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!各种AI能完成各种任务,我们见得多了。但它是怎么想的?它的内部构造是笨拙臃肿
阅读全文专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!1、元技能(Meta Skills)find-skills — 技能发现与安
阅读全文专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!人工智能的下半场,关键词是“行动”。当大模型不再满足于“对话聊天”,而是开始
阅读全文系列文章Claude Code 源码深度解析Claude Code 上下文管理、装配与压缩深度解析Claude Code 长期记忆(Memory)系统深度解析项目信息仓库:NousResearch/h
阅读全文英伟达 CEO 黄仁勋那句振聋发聩的判断,正在成为这个时代最冷酷的职场真相:你不会丢掉工作给 AI,但你会丢掉工作给正在用 AI 的人。Anthropic 2026 年最新研究《Labor Marke
阅读全文⚖️马斯克 v. 奥特曼官司正式开打,马斯克:偷走慈善机构是不对的,OpenAI:他只是「酸葡萄」,没得到他想要的🤖DeepSeek 内测「识图模式」,多模态新模型或将发布📱曝苹果 iOS 27 将大
阅读全文刚刚,DeepSeek 开「天眼」了。V4 发布才 5 天。新功能「多模态识图」灰度上线;LiveBench 榜单更新,V4 开源模型最高分;API 2.5 骨折价再续一个月。陈小康,北大博士,Dee
阅读全文刚刚,Anthropic 公布了 Claude Code 比赛的六组获奖作品。这是 Claude 和 Cerebral Valley 联合办的一场黑客松,规则是:用 Opus 4.7 + Claude
阅读全文图片由 AI 生成当我们谈论AI加速器时,通常会想到GPU或TPU。但为了追求极致的能效和吞吐量,越来越多的定制化AI加速器正在涌现。这些新兴硬件平台往往拥有独特的指令集架构,这为软件开发带来了巨大的
阅读全文当你用中文使用 Claude 处理代码问题或是用纯英文让 GLM 写一篇文档时,有没有想过:同样的内容,用不同语言、不同模型,背后消耗的 token 数量天差地别?而每多消耗一个 token,都是在为
阅读全文Boris Cherny 今天发了一条关于如何充分利用新发布的 Opus 4.7 的长帖(见解确实不错)。Boris Cherny 自我宣传他对 Opus 4.7 的使用给了 6 个技巧 来提升使用效
阅读全文分布式计算早就不是什么“高冷技术”了——它就像我们每天用的手机、电脑一样普及,而你能刷到这篇MPI教程,本身就说明你已经走在了并行编程的路上。不管你是为了课程作业、工作需求,还是单纯对并行/分布式
阅读全文这节课将通过一个基础的 MPI Hello World 程序,带大家掌握 MPI 程序的基本结构,同时详细讲解如何编译、运行 MPI 程序,核心涵盖 MPI 环境初始化、进程管理等基础知识点,帮大
阅读全文在之前的教程中,我们一直使用默认通讯器 MPI_COMM_WORLD。对于简单程序而言,这已经足够满足需求——毕竟这类程序的进程数量较少,通信场景也相对简单,通常只需与单个进程对话,或与所有进程同
阅读全文2026-04-29 GitHub日Star榜 每日精选最值得关注的开源项目 1. open-design(热度: 2829) Open Design 是一个开源设计工具,通过19项技能和
阅读全文新智元报道 编辑:KingHZ Aeneas【新智元导读】世界模型黑马横空出世!就在刚刚,生数科技的MotuBrain零宣发登顶双榜,直接打通「看懂世界+执行行动」,而且不同的是,他们把Worl
阅读全文新智元报道 编辑:元宇【新智元导读】4月28日,Google Translate满20岁。Pichai亲自发帖纪念,说Translate这20年,是从「认字」走到「读懂」的过程。从统计模型,到神
阅读全文新智元报道 编辑:LRST【新智元导读】AutoSOTA通过多智能体协作,将AI研究中繁琐的性能优化过程自动化,使科研从「手工艺」转向「工业流水线」。只需5小时即可完成人类需数月的工作,极大释放
阅读全文田晏林 发自 凹非寺量子位 | 公众号 QbitAI一家做视频的公司,造了个机器人通用大脑。这不是段子,是真事。区别于传统的专用机器人大脑,这个“大脑”既具备世界模型的预测推演能力,又能输出行动指令,
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAIDeepSeek的视觉功能,真的来了!!DeepSeek研究员陈小康发帖放出一条消息——Now, we see you.随后,另一位研究员陈德里也跟了
阅读全文Avenir-Web 团队 投稿量子位 | 公众号 QbitAIAI冲浪不丝滑?伦敦大学学院(UCL)、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web,让现有多模态模型像人类一样使用
阅读全文刚刚,DeepSeek 的「识图模式」开始灰度了。网页版和 App 里,有些用户已经能看到它和「快速模式」「专家模式」并列出现。后端配置里也能看到“name: 识图模式、description: 图片
阅读全文TalkDeepSeek V4 发布后的几天,硅谷那边一直在发酵,也带来了几个更尖锐的问题讨论:模型效率、芯片格局、IPO 时点、开源对闭源的挤压而今天,业内的一些朋友也来到 B 站,带来了高质量的前
阅读全文它会入职,理解上下文,背上 OKR,甚至拥有一个自己的工位。👦🏻 采访及编辑:十字路口🧑🎨 排版: NCon4月24日周五晚,Helio.im创始人王文锋在即刻上发了一个内测帖,介绍了Sheet 0
阅读全文01 导语过去十年,压缩在 CV 学术圈一直是个边缘方向——做生成、做大模型才是显学。但 SparcAI 的两位95后创始人各自做了多年压缩,然后在同一间 NTU 实验室相遇,两年后发布了 Sparc
阅读全文图片来源:Unsplash据《华尔街日报》报道,OpenAI 最近未能达到其自身设定的新用户获取和销售目标,这引发了内部对公司可能难以支持其在 AI 基础设施上支出的担忧。《华尔街日报》周一援引知情人
阅读全文