早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR
新智元报道 编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用
阅读全文新智元报道 编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用
阅读全文Overview通常,在调试 TensorRT-LLM 模型时,我们希望打印出中间的张量值。TensorRT-LLM 遵循“define-and-run”的模式,因此我们需要将感兴趣的中间张量标记为
阅读全文最近,如果您一直在关注装机市场或半导体股票,大概率被一个传闻刷屏了:“谷歌发布了一项名为TurboQuant的技术,能把AI模型的内存占用压缩到极限,直接导致了全球内存条价格暴跌。”资本市场和科技圈的
阅读全文克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI进入营销行业,已经是定局。艾瑞咨询报告显示,去年中国AI营销市场规模达669亿元,年复合增长率26.2%。这个增速背后,是整个行业链条——从内容
阅读全文西风 发自 凹非寺量子位 | 公众号 QbitAIGitHub OCR项目之王刚刚历史性易主。诞生近40年、统治OCR领域的技术标杆Tesseract OCR,被中国开源拉下王座——百度文心衍生模型P
阅读全文光明实验室&清华大学 投稿 量子位 | 公众号 QbitAI几何问题,真的只是“推理难”吗?近年来,视觉语言模型(VLMs)在图文问答、表格理解、数学应用题等多模态任务上取得了显著进展。但当问题变成几
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI中国生成式AI正在进入产业深水区。这两年,AI从“新技术”变成了“新工具”,又从“新工具”慢慢变成企业必须面对的现实。它不只在改变内容生产,也在影响研发
阅读全文放弃像素重建,绕开自回归:14 篇论文看透 JEPA 世界模型演进。Yann LeCun一直在走一条与主流大语言模型截然不同的路。当行业焦点集中在模型参数规模的暴力扩展时,他将研究重心完全放在了世界模
阅读全文随着 AI 生成图像技术快速演进,伪造内容在网络传播风险持续上升,高鲁棒性检测技术因此成为学界与产业界关注的关键问题。然而,现有不少方法过于追求单一数据集上的短期收益,往往仅围绕“真/假”二分类目标对
阅读全文整理 | 褚杏娟 Anthropic 团队正以极高强度内部试用 Claude Code。在过去 52 天里,Claude 团队推出了 50 多项重大功能更新。x 上有消息称,Anthropic 80%
阅读全文作者 | kate holterhoff(RedMonk) 译者 | 平川 策划 | Tina 本文最初发布于 RedMonk 官方博客。AI Slop 正在撕毁开源开发中维护者和贡献者之间不可或缺的
阅读全文最近你有没有发现,身边有人还用 AI 写文案、做总结,而有人已经让 AI 每天自动整理资料、生成内容,甚至帮他跑业务?差距,比你想象的要快得多。如果你持续关注 AI,会明显感受到一个趋势:会用 AI
阅读全文过去两年,我们每天都在做同一件事:学习和进修「提示词工程」这门玄学。找 AI 干活,总要像个碎碎念的甲方一样,交代八百字背景,像是在哄一个智商奇高、但每天都会间歇性失忆的实习生。这让我想起在游戏里,施
阅读全文OpenAI 宣布关停 Sora,25 个月便黯然退场,只为腾算力备战 IPO,连迪士尼巨额合作也告吹。反而国内 AI 视频发展迅猛,多款产品年收入可观,创作者与生成视频数量庞大。核心差异在于国内工具
阅读全文▎别再卷单次任务的通过率了,是时候想想怎么让AI学会「为未来写代码」。作者|硅谷Tech news编辑|焦燕本文首发于钛媒体APP凌晨两点的工位,程序员小李盯着屏幕上Claude刚写的第三版代码欲哭无
阅读全文Web死了,现在轮到APP和MCP死了。CLI被捧上神坛,就好象命令行一出,AI就能统治世界。先是我把飞书客户端卸了! 官方CLI来了,专门为 AI Agent 设计再是企业微信wecom-cli一夜
阅读全文昨晚开始 DeepSeek 崩了,工程师奋战12 小时后早上终于修复。这次宕机引发网友一片哀嚎,因为对很多人来说,「生活已经不能没有 AI 了。」这句话,越来越多的人说出口时,语气已经不像抱怨,更像陈
阅读全文RESEARCHUniPat AI 做了一件事:让 AI 去预测还没发生的事,比如下个月哪家公司市值最高、某国会不会对另一个国家加关税、某个政客会不会在社交媒体上发超过 100 条帖子他们搭了一套系统
阅读全文作者|黄小艺邮箱|huangxiaoyi@pingwest.com过去几年,AI每一次进化,都在向前推进一步:从Chatbot的提问框,到Agent的云电脑,再到OpenClaw这样能同时操控本地与云
阅读全文作者|猫猫头邮箱|cathy@pingwest.comGarry Tan在各种场合反复说过一句话:「atoms not bits」。我并不理解其深意。直到我观摩了W26的Demo Day,这句话终于有
阅读全文ESSAY一个传统后端工程师看 Claude Code 自动生成的代码,命名混乱,不遵守团队规范,几百行逻辑挤在一个文件里。他的评价:屎山反过来,一个跑在 Claude Code 上的 agent 试
阅读全文图片来源:Peter DiamandisZ Highlights我们现在就正处于hard takeoff阶段。这么说吧:在目前这个阶段,我去睡一觉,AI领域就会出现一些巨大的突破。当我醒来时,又会有一
阅读全文3.16-3.22 TOP10TOP1:Stitch 2.0 by Google一句话描述:Stitch 2.0 是 Google 做的“AI‑native vibe 设计搭子”,用自然语言、语音和多
阅读全文图片来源:Physical IntelligencePhysical Intelligence 是一家成立两年的机器人初创公司,由人工智能学者和前 Google DeepMind 研究人员创办,据知情
阅读全文图片来源:Cohere企业人工智能公司 Cohere 于周四发布了其首个语音模型:Transcribe 是一款开源自动语音识别模型,可用于笔记记录和语音分析等任务。该模型仅包含 20 亿参数,相对轻量
阅读全文给AI一个主题,它真的能跑完整个科研流程吗?👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon最近一个月,我们已经见识过了非常多的 OpenClaw 产品。有做客服的,有做营销的,有做内容
阅读全文上周发了给Agent用的superpowers插件那篇文章。没想到反馈还不错,Skills这块的信息差,比我想的还要大一些= =然后评论区里就有人问了,还是一个叫tim的朋友,问还有什么必装的Skil
阅读全文