当 AI 学会欺骗和灭迹:Anthropic 244 页报告揭示的困境
AI 甚至会在 CoT 中隐藏自己的思考。本文作者 : Yan Wang / 鸭哥Samsara 应用科学家,哥伦比亚大学博士,曾在 Pinterest / Microsoft 等公司工作,发表过近4
阅读全文AI 甚至会在 CoT 中隐藏自己的思考。本文作者 : Yan Wang / 鸭哥Samsara 应用科学家,哥伦比亚大学博士,曾在 Pinterest / Microsoft 等公司工作,发表过近4
阅读全文本周 AI 快讯 | 1 分钟速览01 《时代》2026 最具影响力 AI 十强揭榜,字节智谱阿里占三席 :字节跳动凭豆包 1.55 亿周活和抖音 7.7 亿月活入选,估值超 5500 亿美元;智谱以
阅读全文定义氛围编程是一种新兴的软件开发模式:开发者借助人工智能(AI),通过自然语言提示生成可运行代码,大幅提升开发效率,同时降低编程门槛,尤其适合编程基础薄弱的人群快速搭建应用。该概念由AI研究者安德烈
阅读全文新模型发布之后,除了发现能力变强。大部分人还是会觉得新版本的模型,好像不如旧版听话,第一反应就是降智了。实际情况可能恰好相反。OpenAI 和 Anthropic 几乎在同一时间发布自己的提示词文档,
阅读全文五一假期,AI圈被一场演讲彻底刷屏。前特斯拉AI总监、OpenAI联合创始人Andrej Karpathy,在2026年4月底红杉Sequoia AI Ascent大会的炉边对谈中,抛出了一套颠覆所有
阅读全文CLAUDE.md 是为 Claude Code 提供项目特定上下文的关键文件。它相当于让 AI 了解你项目需求和代码库的入门指南。无论 Claude 的 AI 模型在你的项目中编写新代码还是修改现有
阅读全文2026-05-02 GitHub周Star榜 每周精选最值得关注的开源项目 1. open-design(热度: 13537) Open Design 是一个开源设计工具,通过19项技能
阅读全文APPSO 今天发现,苹果官网已经悄悄下架了 256GB 入门款版本的 Mac mini,现在最低配置为 16GB+ 512GB,起售价也涨到了 5999 元。倒也别急着吐槽库克精准的「刀法」,在这个
阅读全文新智元报道 编辑:桃子 好困【新智元导读】深夜王炸!奥特曼官宣ChatGPT与OpenClaw全面合体,一键登录。Codex同步开启「宠物模式」,支持自主迭代与一键搬家,Anthropic这下真
阅读全文新智元报道 编辑:元宇【新智元导读】马斯克囤了几十万张卡,结果只跑了11%?据媒体报道,xAI的MFU只有约11%,xAI总裁Michael Nicolls在内部备忘录中称这一数字「低得尴尬」。
阅读全文新智元报道 编辑:LRST【新智元导读】中国科学院团队推出类脑大模型「瞬悉2.0」,通过优化架构与编码路径,显著提升了长序列处理效率与低功耗部署能力。该模型在保持高性能的同时,大幅降低训练与推理
阅读全文机器之心编辑部在大模型「卷生卷死」的今天,大家似乎已经习惯了模型在各大榜单上刷出逼近满分准确率。然而,在一项名为 ARC-AGI-3 的基准测试中,堪称当下「最红炸子鸡」的两款顶尖模型 ——OpenA
阅读全文本篇论文已被 ACL 2026 接收,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。团队负责人为关新平教授,指导老师为陈彩莲教授和乐心怡教授,合作作者还包括南洋理工大学陶大程教授。其他
阅读全文整理|冬梅 如果把过去两年的 AI 叙事拆开来看,一个趋势已经越来越清晰:真正的瓶颈,正在从“模型能力”转向“资源分配”。一边是推理成本持续下降、调用门槛几乎被抹平,另一边却是算力、带宽乃至组织内部认
阅读全文科技巨头将资本支出与现金流的底牌亮出后,投资者开始为巨额AI投入的确定性回报投票。文|TechHorizon作者|杨丽编辑 | 杨林本文首发于钛媒体APP本周,亚马逊、微软、谷歌相继发布新一季度财报。
阅读全文SMARTFLOW · AI DAILY · 05/01「LLM 不只是在加速已有的东西,是在打开几条全新的地平线。」— Andrej Karpathy4-29 Sequoia Ascent 2026
阅读全文作者|吴瑞琪邮箱|rachelwu@pingwest.com“人类智能 = 推理 + 长期记忆”。当AI 推理能力的竞赛进入白热化,整个行业开始意识到:infra层面的记忆缺失,正成为限制 AI 走向
阅读全文"一代人有一代人的黄冈密卷。80后埋头刷卷子,90后抱着学习机,00后刷手机搜答案。到了10后这代,出现了一种新的学习范式:不会的题,不用等老师;想练口语,不用请外教;想刷题,直接让AI给自己造一套。
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI苹果大失误!把自用的Claude.md打包到了官方App里。这下直接被坐实了:苹果内部在使用Claude Code构建生产级应用。这么大的公司,也在V
阅读全文腾讯混元团队 投稿量子位 | 公众号 QbitAI离线翻译这件事,正在从“能用”走向“好用”。对出国旅行、跨境办公和本地阅读来说,翻译工具一旦依赖联网,就很容易在弱网、无网或隐私敏感场景里掉链子。但把
阅读全文Codex 今天上线了一个新功能:养宠物。没错,就是字面意思。你的编程工具现在可以养一只虚拟宠物了。宠物角色OpenAI 官方的介绍是:“ Pets. Now in Codex. Use /pet t
阅读全文你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里?它不在百慕大,也不在诺兰导演的电影里,而是在你的 DeepSeek、Claude 或者 ChatGPT 正在思考的过程里。不
阅读全文系列文章驾驭式软件工程:智能体优先范式下的 Codex 赋能开发摘要当AI编程工具逐渐成为研发标配,你是不是也遇到过这样的瓶颈:同时开着3-5个Codex会话,一会要给这个会话修正方向,一会要给那个会
阅读全文在一个无人注意的角落,Grok 4.3,来了。4 月 17 日,Grok 4.3 Beta 版率先在 Grok 上线,但只对 SuperGrok Heavy 付费会员开放。300 美元/月。昨天,Gr
阅读全文OpenClaw 2026.4.29 是一版很典型的平台中层能力扩张型预发布:active-run queueing 默认转向 steer-first,全局 messages.visibleRepli
阅读全文本系列AI前端小课从零到全栈的这节我们来实现在微信上远程Claude Code。演示视频如下:有了这套方案之后,可以轻松地实现在床上、车上、厕上通过拿手机微信快速地接入远程的Claude Code环境
阅读全文2026-05-01 GitHub月Star榜 每月精选最值得关注的开源项目 1. caveman(热度: 51624) 这是一段帮助Claude像原始人一样简洁表达的技能,能大幅减少to
阅读全文最近AI Agent赛道卷到极致,但绝大多数团队都卡在同一个死局:demo惊艳全网,上线直接翻车。本地测试丝滑流畅,生产环境故障不断。疯狂堆叠Agent、工具、工作流,最后系统混乱失控、无法溯源、不敢
阅读全文