AI大神Karpathy 力挺「强化学习环境」,但千万别去创业!
今天来聊一下——强化学习。因为在 AI 领域,很少有技术能像强化学习(Reinforcement Learning, RL)这样引发如此矛盾的情绪。强化学习,第一次进入大众视野,是因为 AlphaGo
阅读全文今天来聊一下——强化学习。因为在 AI 领域,很少有技术能像强化学习(Reinforcement Learning, RL)这样引发如此矛盾的情绪。强化学习,第一次进入大众视野,是因为 AlphaGo
阅读全文凌晨一点,OpenAI 发布了 GPT-5-Codex,但这次,所有想调用 API 的开发者可能要失望了。OpenAI 做了一个决定:Codex 并不通过 API 开放。你不能靠 key 来偷偷调用
阅读全文就在刚刚,Anthropic 发布了一报告,名字听上去有点学术腔——《人类经济指数》。但别被这个名字骗了,它是一份非常具体、非常当下的观察笔记,可以说和我们息息相关。原文链接:https://www.
阅读全文昨天半夜刷到 MiniMax 又搞事情了,这次轮到音乐大模型升级。说实话,看到这个消息我第一反应不是“哇好厉害”,而是想到一个问题:中国在声音这个赛道上,要翻身了。前段时间 MiniMax 的 Spe
阅读全文家人们,你敢信吗?一家成立仅半年,0 产品、0 用户的初创公司,估值已经飙到了 102 亿美元(约合人民币 850 亿)!你没听错,数字是真的,事儿也是真的。这家公司,就是由前 OpenAI CTO、
阅读全文一夜之间,Cluade 的口碑好像崩了。不仅是因为他家 CEO 的反华言论,还有被 OpenAI 玩烂的套路——模型降智。前几个月吹得太猛,大家都觉得 Claude 是“编程最厉害的 AI”,没想到现
阅读全文最近,Nano Banana 在各种社交媒体上都玩疯了。合影、换装、分镜、生成视频……你随便刷刷 X、小红书、抖音,到处都是人用它把自己 P 进火影忍者、甄嬛传、演唱会后台,无痛追星。但评论区里,最多
阅读全文说到 Claude,不少人第一时间想到的是“封号”。好像只是换个平台的事,没什么大不了。但现实是,一封 API 停用的邮件,就能让几百人的工作一夜之间没了。8 月 2 日,OpenAI 内部的一群评测
阅读全文模型也怕猫?你敢信吗?只要在提示词里加一句“猫一生中大部分时间都在睡觉”,原本表现优异的大模型立刻陷入混乱,错题率暴涨 3 倍。这种“猫猫级”废话,竟然成了压垮 AI 理性链条的最后一根稻草。这项研究
阅读全文九三阅兵,你看了吗?今天上午公司放假,在家看阅兵直播。我身边从早上九点开始就炸了。就连我爸,那个从不关心啥技术的老头,今天破天荒发了一条朋友圈,只写了四个字:祖国万岁。在这种时候,你真的会被震憾到。太
阅读全文这几天,我的小红书被一个港科的项目刷屏了。它叫 aivilization,一个住着两万多个 AI 的小镇。对,就是 AI,不是 NPC。有人还记得之前火出圈的斯坦福小镇 Smallville 吗?当年
阅读全文这段时间 AI 编程的热度完全没退,一个原因是国内接连推出开源了不少针对编程优化的大模型,主打长上下文、Agent 智能体、工具调用,几乎成了标配,成了 Claude Code 的国产替代,比如 GL
阅读全文今天你点进 Claude 的时候,会看到这样一个弹窗:这是 Claude(Anthropic 的 AI 助手)今天更新了用户条款和隐私政策:允许 Claude 使用你的聊天内容和编程会话,用于训练和改
阅读全文说个热知识,现在的大模型,也可以轻松被投广告了。我们之前也确实发现过这类现象,当时是在研究一家做 GEO(生成式引擎优化)的公司。通过在网上堆出大量正面内容,把某个特定品牌、网站、课程甚至微商产品,默
阅读全文昨天晚上,爆火了一周的图像生成与编辑模型 nano-banana 终于揭开了真面目。其官方名称为 Gemini 2.5 Flash Image,在 LMArena 基准测试中一举登顶,成为当前 AI
阅读全文DeepSeek V3.1 上线没几天,就翻车了。昨天晚上,知乎上有网友发帖说,她当时正在用 DeepSeek V3.1 整理一套物理试卷,里头有不少公式和 LaTeX 代码。但是输出的时候,模型突然
阅读全文一句话生成分钟级爆款视频的时代已经到来。在软件领域,Vibe Coding 的核心在于:让开发者摆脱繁琐、低产出的代码编写,把体力活交给 AI,从而专注于更高维度的产品迭代与创意探索——追求的是 效率
阅读全文今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件
阅读全文8 月 20 日,中国科学院与中国工程院官网同步更新,公布了 2025 年两院院士增选的有效候选人名单。两院院士作为中国科学技术与工程技术界的最高终身荣誉学术称号,每两年一次增选。根据官方数据,今年两
阅读全文就在昨天晚上,DeepSeek 官方正式宣布,旗下线上版本模型已更新迭代,正式升级 DeepSeek V3.1!根据 DeepSeek 官方发布的信息以及社区内部的初步测试,V3.1 版本的主要更新点
阅读全文作为大家的测评博主,我最近发现一个巨有意思的现象:现在市面上大部分评估 Agent 的基准测试,倾向于考核“单项技能”,而非“综合任务”。比如,你让 AI 点份外卖,它能完成;但如果要求它策划一场涵盖
阅读全文你有没有想过,Meta 训练 AI 用的数据里,有可能不只是维基百科、小说、YouTube 视频……而是你在某个晚上偷偷下载的成人电影?你没听错。是色情片。而且不是三两个,而是 2396 部!就连提起
阅读全文就在刚刚,昆仑万维发布了 Mureka V7.5,一个专门为中文升级的音乐大模型。老实说,这两年 AI 做音乐已经卷出了天际——Suno、Udio、Riffusion,一个比一个能唱,特别是英文歌,人
阅读全文昨天,Google 的一位开发负责人和 DeepMind CEO Demis Hassabis 进行了一场对谈。视频地址:https://www.youtube.com/watch?v=njDochQ
阅读全文聊起严肃的编程,Anthropic 的 Claude 几乎是公认的王者,在很多开发者心里都是 No.1 的位置。但最近,风向似乎有点变了。OpenAI 发布了 GPT-5,我在公众号里、社群里、论坛里
阅读全文GPT-5,终于来了。从年初传到年中,今天凌晨一点的发布会,OpenAI 总算没再放鸽子。跟 GPT-4o 的实时多模态体验不同,这次硬件、功能、交互统统缺席;唯有榜单。一口气出了 25 个榜单成绩单
阅读全文今天凌晨,OpenAI 发布了 GPT-OSS,可在本地运行的 o4-mini 级别开源模型。GPT-OSS 是 OpenAI 在 GPT-2 后,时隔 6 年第一次开源动作。除了开源,还释放了一个信
阅读全文就在前几天,OpenAI 又搞了个大动作。他们要在德州阿比林,新增 4.5GW 的电力接入,并且已经和 Oracle 签好了合同。你没看错,4.5GW,相当于五座核电站。Sam Altman 自己在
阅读全文你有没有这种感觉?最近 AI 圈像是压着一口锅,所有人都在等一样东西出来。GPT-5。不管你是不是 AI 行业的人,这几个字现在都开始有点玄学意味了。只能说 Sam Altman 能不能别在营销上整手
阅读全文上下文工程(Context Engineering)现在有多火,就不用多说了吧。Karpathy 说「Software is changing (again)」,“again” 的下一个注脚,大概率就
阅读全文