大模型如何「在思考中使用工具」|Interleaved Thinking
DeepSeek V3.2 提到了一个东西,属于核心迭代「在思考中,使用工具」技术报告里,把这个叫Thinking in Tool Use在这里与大家说道,这东西的由来、演进和现状,方便吹牛逼用这里
阅读全文DeepSeek V3.2 提到了一个东西,属于核心迭代「在思考中,使用工具」技术报告里,把这个叫Thinking in Tool Use在这里与大家说道,这东西的由来、演进和现状,方便吹牛逼用这里
阅读全文Mistral 发布了 Mistral 3 系列去年的时候,他们是开源届的当红炸子鸡然后...已经一年多没发模型了Base Model 对比,对标 DeepSeek 和 Kimi他们的官方对比很有意
阅读全文刚刚,Sam Altman 发了封内部信公司进入「Code Red」状态Code Red这是是最高级别的紧急状态,意思是:放下手里所有事,集中一切资源,解决眼前这一个问题Altman 原话:「Cha
阅读全文这是一篇报告解读,原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》后台回复 DS-V3.2 获得这份报告先
阅读全文Prashanth 是 Stack Overflow 的 CEO在 OpenAI 前两天的一场活动中,他做了分享:他又开始写代码了,因为 AI 太好用了emmmm...你们看错,Stack Over
阅读全文Ilya Sutskever 昨天接受了 Dwarkesh Patel 的播客采访这是他离开 OpenAI、创办 SSI 之后,最深度的一次公开发言为了方便大家路上听,这里我做了一份中文配音版,使用
阅读全文Nature Machine Intelligence 封面《Densing Law of LLMs》 论文,登上 Nature Machine Intelligence 封面这篇论文,提出了一个很
阅读全文今天,Anthropic 发布了 Claude Opus 4.5,目前编程能力最强的大模型SWE-bench 对比图更多成绩成绩:• SWE-bench Verified:80.9%(GPT-5.1
阅读全文Nano Banana Pro 正式发布,正式名称为 Gemini 3 Pro Image,是 Google最新一代图像模型(并不叫 banana2)然后...还可以让他生成个 Banana Pro
阅读全文前两天,我问了陶芳波一个问题AI 时代的社交,和如今的网络社交,会有什么区别?这里有个背景:上一波互联网中,发力的是多边网络效应,用的人越多,价值就越大,比如微信但现在的 AI 产品,更像一个中心化
阅读全文Gemini 3 封神了,纯粹的强大奥特曼发来贺电(说个八卦:Logan 以前是跟 Sam 的)写这篇文章前,我把这段 Prompt 扔给了刚发布的 Gemini 3 ProPrompt:「编写一个
阅读全文今天,通义改名千问于是很多人懵了通义、千问、通义千问、通义 app、Qwen Chat 到底是啥关系这背后是两个团队的故事2023 年:通义千问诞生2023 年 4 月 7 日,阿里云发布通义千问大
阅读全文本内容由明浩老师提供,在电影院进行的年度暴论非常真实,笑抽了公众号回复「251101」,可获得完整 PPT先放AI总结,后面 PPT以下内容,由「飞书妙计」整理:广告(超大声):先进团队,先用飞书(
阅读全文今天上午,微信群里炸了:苹果手机,即将能在微信里,进行虚拟支付了这是 AI 行业的重大、重大、重大利好,容我细细说背景是这样,苹果搞了个 Mini Apps Partner Program,http
阅读全文今天是百度世界大会,文心 5.0 发布对于这个模型,要点归结如下:• 2.4 万亿参数:MoE架构,激活参数低于 3%• 原生全模态:不同的路线选择,我觉得这是最大的发布,会细说• 40 余测试领先
阅读全文旁听了 OpenAI 首席战略官 Jason Kwon 的一场小范围分享,内容是关于公司最近完成的一次组织架构重组核心信息OpenAI 成立了一个新的非营利组织,叫 OpenAI 基金会。这个基金会
阅读全文OpenAI 办了个网校(应该是这么说),叫 OpenAI Academyhttps://academy.openai.com/这里面,目前有 200+份内容,还有 10 个交流群最大的群组叫做「牛
阅读全文Kimi 开源了新模型:K2-Thinking1T参数,MoE架构,32B激活,原生INT4量化,256k上下文https://huggingface.co/moonshotai/Kimi-K2-T
阅读全文我们的产品团队,都有6个月的时间去完成 PMF搞定了,继续;反之,解散You have six months to prove it. If it's proven, that team will
阅读全文先看我的猫猫从头像到转绘、到视频、配声音、输出4K,在一个画布上完成这是全新SkyReels,来自昆仑万维,今天上线地址:https://www.skyreels.ai核心能力:• 无限画布:三种创
阅读全文今天,OpenAI 公开 Atlas 的核心技术实现,这是一个专门为 Agent 开发的浏览器,让 AI 能够看到完整的界面渲染,而不是需要像人一样,挨个的点击所有元素,才能获得所有信息这也是 Op
阅读全文OpenAI 许给了微软一笔分手费,2500 亿美金然后说:我们都可以去找别人了https://openai.com/index/next-chapter-of-microsoft-openai-p
阅读全文今天凌晨,OpenAI 带来了两则信息• OpenAI 完成资本重组,非营利基金会控制公司,持股估值 1300 亿美元,马上我会详细说一下(单独发一篇)• OpenAI 发布了一场直播,以迄今最大尺
阅读全文ChatGPT 更新了内置模型,叫 gpt-5-oct-3冷知识ChatGPT 会不断的调整其内置模型,和 API 给到的模型并不完全一样gpt-5-oct-3,主要改进了心理相关问题:• 改进了三
阅读全文