LLM推理KVCache的演进阶段KV Cache 详解:LLM 推理中 KV Cache 的完整演进指南文章来源翻译整理自:Luv Bansal《KV Cache Explained: The Co
阅读全文你以前精心写的提示词,可能对 GPT-5.5 不管用了。这是 OpenAI 自己说的。GPT-5.5 上线当天,官方就发布了一整页提示词指南。你之前写的分步流程、绝对指令、超长的角色设定,指南原文用了
阅读全文2026-05-03 GitHub日Star榜 每日精选最值得关注的开源项目 1. keep-codex-fast(热度: 382) 本工具用于清理慢速的Codex本地状态,通过先创建交接
阅读全文16GB 内存跑本地 AI Agent——不是能不能跑的问题,是能跑几个、跑多久实测数据基于 Mac Mini M1 16GB (macmini9,1) 的真实进程 RSS:进程模型RSS (估测)峰
阅读全文本文档系统讲解大语言模型(LLM)训练流程中的核心概念,从预训练到微调,从理论到实践。目录预训练(Pre-training)——让模型"读万卷书"Embeddings——将文字变成数字向量词表与向量的
阅读全文Something maybe wrong过去两年,我的核心工作从「开发」变成到了「生成」,写代码的时间少了,写 Prompt 和 Skill 的时间多了这个五一假期没有出门,想了很久:在新的时代,开
阅读全文你可能不知道:在 2026 年的 AI 面试里,只会说 “我会用 LangChain 写个 Agent” 的人,已经被筛掉了。真正能拿到 offer 的那 1% 工程师,聊的是:如何设计一套让 AI
阅读全文Anthropic 最近关于“functional emotions”的研究https://arxiv.org/pdf/2604.07729提醒我们:agentic 方案不只是工程问题,更是上下文(c
阅读全文Anthropic 的 Opus 4.7 黑客松结束了。500人参赛,10万美元奖池,一周时间,最多两人组队。获奖名单出来,我愣住了。。。金奖:土耳其的一个医生。 银奖:法国的老哥做了一个电路板维修工
阅读全文谁不想在自己的电脑上养一只小宠物,打开电脑,它就坐在那里看着你工作。OpenAI 最近在 Codex 上的更新,引入了类似电子宠物 Tamagotchi 的桌面悬浮伴侣。我们可以在摸鱼的时候,把鼠标悬
阅读全文有一位群友,他用 AI 做了个网页游戏,然后在手机上指挥龙虾🦞去玩这个游戏,然后他看它边玩边给他汇报,然后……他说:“ 突然有了一种巨大的虚无感。这种虚无感从哪来呢?游戏是他做的,AI 是他指挥的,整
阅读全文实战笔记:Macmini9,1 / 16GB RAM / macOS 26.4 / arm64目标在 Mac Mini M1 上跑一个完全本地的 AI Agent——Ollama/MLX/llama.
阅读全文机器之心编辑部一件看似「反常」的人才大迁徙,正在硅谷悄然发生……事情是这样的,前两天,一位博主 Henry Shi 在 X 上发文称,自己看到科技界正在发生奇怪的事情,「一些曾经管理着数十亿美元公司业
阅读全文在自动驾驶的日常测试视频里,我们常能看到这样的场景:一辆无人车驶入幽深的地下车库,GPS 信号瞬间罢工,它只能靠激光雷达扫描周围环境,试图弄清楚 “我在哪”。然而,车辆可能已经原地掉头,拐过了好几个弯
阅读全文整理 | 傅宇琪、褚杏娟 DeepSeek 发布多模态模型及技术报告,终于能“看图”了!V4-Pro 优惠再延;小红书官宣组织调整:柯南出任总裁,成立 AI 一级部门;百度发全员信通知职级体系大调整;
阅读全文新智元报道 编辑:艾伦【新智元导读】Anthropic 的 ARR(年化运行收入)已升至 440 亿美元,12 个月新增 350 亿美元。企业客户、Claude Code 和推理毛利率改善,共同
阅读全文新智元报道 编辑:KingHZ【新智元导读】AI创造生命的一大步!斯坦福团队用AI造出从零写出16种噬菌体,内含地球前所未有的蛋白,Anthropic CEO预警:6到12个月,傻子也能造超级病
阅读全文新智元报道 编辑:元宇 大卫【新智元导读】谷歌最新实验Vantage,派AI假扮你的同事,按剧本跟你唱反调、搞情绪化施压。考的不是你知道什么,而是你在压力下怎么做人。考试考了几千年,还从来没人考
阅读全文大家好,我是HxShine今天分享一篇由DeepSeek-AI联合北京大学、清华大学发表的文章,Title: Thinking with Visual Primitives(使用视觉图元进行思考)。
阅读全文henry 发自 凹非寺量子位 | 公众号 QbitAIDeepSeekV4的技术报告里有mHC,有CSA,有HCA,有Muon,有FP4……唯独没有Engram。Engram去哪了?这个话题一度成为
阅读全文清华AIR DISCOVER Lab 投稿量子位 | 公众号 QbitAI具身人工智能领域,正向着以视觉为中心的感知范式,发生全面而深刻的转型。作为机器人感知世界时信息密度最高、与自然人机交互最契合的
阅读全文作者|樊雅婷邮箱|fanyating@pingwest.comGPT Image 2 凭什么这么强?是扩散模型又迭代了一版?是把 DiT 的参数量从 7B 扩到 20B?是训了更多高质量数据?这些答案
阅读全文新模型发布之后,除了发现能力变强。大部分人还是会觉得新版本的模型,好像不如旧版听话,第一反应就是降智了。实际情况可能恰好相反。OpenAI 和 Anthropic 几乎在同一时间发布自己的提示词文档,
阅读全文上个月刚充了 ChatGPT Plus,这个月又买了了 Cursor Pro,OpenClaw 也研究的差不多了。我们对 AI 的期待,说起来非常简单:给最好的方案、最准确的代码、最精确的回答。然后我
阅读全文AI写代码到底有多烧钱?作者|硅谷Tech news编辑|赵虹宇本文首发于钛媒体APP想象一下这个场景:你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下
阅读全文SMARTFLOW · AI DAILY · 05/02「旧岗会消失,新岗会涌现。」— Sam Altman5-2 GPT-5.5 派对日 · 一条推文回复2026-05-02 · 第 123 期 ·
阅读全文一、核心摘要论文标题:《Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Ha
阅读全文作为CLI形态的Claude Code最麻烦的一点是就是不好搜索聊天记录。Claude Code 把所有会话数据存在本地 ~/.claude/projects 目录里的JSONL文件里面。这些原始文件
阅读全文