Claude Code 将登录 Claude App
Anthropic 正在把 Claude Code 内置到 Claude 手机 APP 中!据 TestingCatalog News 最新爆料,Anthropic 正在准备将 Claude Code
阅读全文Anthropic 正在把 Claude Code 内置到 Claude 手机 APP 中!据 TestingCatalog News 最新爆料,Anthropic 正在准备将 Claude Code
阅读全文OpenAI DevDay 即将开始。而刚刚,Sam Altman 提前发文称对明天的 AI DevDay 充满期待,准备发布一些「帮助大家用 AI 构建应用」的新工具。而在此之前,OpenAI 总裁
阅读全文Sora 2 在推理基准测试上拿到了 55% 的成绩。要注意,这并不是个视频质量评分,而是 GPQA Diamond,一个专门测试大语言模型科学推理能力的基准,题目长这样:而作为对比,GPT-5 在同
阅读全文对 Richard Sutton 采访的再思考作者:Dwarkesh Patel 下为其在9月27日采访《强化学习之父:大语言模型走错了路,不符合「苦涩教训」精神》后的反思。你们对 @RichardS
阅读全文「苦涩教训」的作者,其实并不认可大模型对「苦涩教训」的实践。见前文:强化学习之父:大语言模型走错了路,不符合「苦涩教训」精神而刚刚,Andrej Karpathy 也发表了一篇长文深度解读了 Sutt
阅读全文今年 6 月,Andrej Karpathy 就提出:提示词工程该改名了。他建议用「上下文工程」(context engineering)取代「提示词工程」(prompt engineering)。K
阅读全文编程智能体迎来质变时刻!Anthropic 刚刚发布的 Claude Sonnet 4.5,不仅宣称是世界上最强的编程模型,更是将自主编码时间从 GPT-5-Codex 的 7 小时推进到了 30 小
阅读全文Anthropic 研究员 Jascha Sohl-Dickstein 最近分享了一个关于 AGI 来临的演讲。他说,我们可能正处于人类作为地球主要智慧生物的最后几年。演讲标题致敬了诺贝尔奖得主 Ra
阅读全文刚刚,一个 4 人团队打败了所有科技巨头的编程智能体!Factory AI 的 Droid 在 Terminal-Bench 基准测试中拿下 58.75% 的成绩,超越了包括 OpenAI、Anthr
阅读全文刚刚,Thinking Machines 实验室发布了他们的第二篇 Connectionism 研究文章,提出了一个叫做模块化流形(Modular Manifolds) 的理论框架,试图通过在权重矩阵
阅读全文AI 被用来算经济账了!刚刚,OpenAI 推出了 GDPval,一个专门评估 AI 在真实经济价值任务上表现的新基准。这次,OpenAI 不玩虚的了,直接把 AI 拉到经济战场上——看看你到底能创造
阅读全文AI 已然占领了整个技术圈!刚刚,Google 发布的年度「DevOps Research and Assessment(DORA)」报告显示:在接受调查的近 5000 名技术专业人士中,90% 的人
阅读全文刚刚,Sam Altman 发布了一篇名为Abundant Intelligence的新博文,勾勒出 OpenAI 野心勃勃的 AI 基础设施愿景。山姆•奥特曼在文中表示,AI 服务的增长速度令人惊叹
阅读全文刚刚,美团宣布高效推理模型 LongCat-Flash-Thinking 正式发布。新模型在保持龙猫模型一贯「快」特点的同时,在逻辑、数学、代码、智能体等多个领域的推理任务中,也达到了全球开源模型的最
阅读全文想必你已经看到了 Meta Reality Labs 在昨天 Meta Connect 大会现场演示翻车的尴尬之事了。来看视频:小扎当时一脸尴尬到脚趾抠地了,试了无数次后……终于放弃了。当时他的内心估
阅读全文AI 写代码爽归爽,但删库跑路也是真的会发生!吴恩达最新分享了他们团队使用 AI 编程助手的血泪史:一个 Agent 竟然执行了 rm *.py 命令,把整个项目的代码全删了!更离谱的是,当被质问时,
阅读全文Claude 再次解释:八月到九月初,它确实出问题了。刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。虽然他们像是说了些
阅读全文终于,AI Agent 们可以直接转账了!刚刚,Google 和 Coinbase 刚刚联手搞出了一个大动作:Agentic Payments Protocol(AP2),配合 x402 稳定币支付轨
阅读全文编程新王者真的要来了!刚刚,OpenAI 发布了 GPT-5-Codex:一个专门为 Agent 编程优化的全新模型。并且,该模型同步在 Codex CLI、IDE 扩展、网页端、移动端以及 GitH
阅读全文99% 的 Agent 创业公司,都可以扔掉你的代码了转用 Claude Code SDK 来实现了。刚刚,Claude Code SDK 发布了支持自定义工具和钩子函数的更新:Claude Code
阅读全文现在,Claude可以直接操作 iOS 的提醒事项了:只需要直接告诉他对应的任务,他就会申请系统提醒事项的权限(首次使用时),并为你设定合适的日程。看着很简单,对不对?但我想说:从现在起,所有 tod
阅读全文Mira Murati 的新公司终于发声了!Thinking Machines Lab 今天正式推出了他们的研究博客 Connectionism,第一篇文章就直接瞄准了 LLM 推理中让人头疼的「非确
阅读全文刚刚,Claude 发布了一个重磅更新:可以直接生成Excel和PPT了!现在,Claude可以直接创建和编辑各种文件:Excel表格、Word文档、PPT幻灯片、PDF文件,通通不在话下。官方演示视
阅读全文Claude又双叒叕修好了!刚刚,Anthropic发布声明,称已经找到并解决了两个影响Claude响应质量的问题,并承诺会继续监控任何潜在的质量问题。这已经是短短10天内,Anthropic第二次承
阅读全文刚刚,Anthropic 宣布支持加州参议员 Scott Wiener 提出的 SB 53 法案!继上周封禁中国公司 API 访问后,这家 AI 公司表示,该法案为监管前沿 AI 公司构建的强大 AI
阅读全文美团外卖悄悄推出了 AI 模型API 平台。刚刚,继上周推出LongCat大模型之后,美团直接把API平台给放出来了。而且,他们不仅兼容OpenAI的API格式,还支持Anthropic的接口协议。从
阅读全文Claude 快把自己玩死了!昨天,美国头部大模型公司 Anthropic 宣布停止向多数股权由中国资本持有的集团出售服务,范围涵盖中国大陆及通过海外注册或云服务间接使用的企业。不得不说,这简直是极其
阅读全文你敢信,Ilya Sutskever 竟然为了一个秃头鼠标破防了!这位 SSI 创始人、前 OpenAI 首席科学家,今年只发过一条推文的男人,突然冒出来评论了一句:如果我见过的话,这是一个革命性的突
阅读全文