o3视觉推理,暴打了Gemini 2.5 Pro和Claude 3.7 Thinking
今天凌晨,OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台,称 o3 的智能达到和接近天才水平。而且还有人说,OpenAI 这次又重回王座。当然,从官方放出来的榜单结果看,
阅读全文今天凌晨,OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台,称 o3 的智能达到和接近天才水平。而且还有人说,OpenAI 这次又重回王座。当然,从官方放出来的榜单结果看,
阅读全文在今天凌晨的线上发布会上,OpenAI 一次推出两款全新模型 o3 与 o4‑mini ,并宣布它们立即向 ChatGPT Plus、Pro 与 Team 订阅者开放,引入了可直接“用图片思考”的多模
阅读全文家人们!最近奶茶发现一篇看起来非常有意思的论文!你们有没有想过,咱们的大脑一辈子到底能“装”下多少知识?最近,加州理工学院算出了人类学习的“终极天花板”——就算你是个卷王之王,24 小时不眠不休、过目
阅读全文我发现,AI 领域的竞争越来越多元化了。以前,大家往往比拼模型的参数规模、模型效果;后来,大家开始卷价格;就在今天,智谱 AI 这位老哥,突然开源了一个速度起飞的推理模型,直接把“速度”这张牌打成了王
阅读全文最近,谷歌不管是大模型,还是产品,上新的动作都有点频繁。。。昨天,他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro。Gemini 2.5 Pro,就
阅读全文大家假期休息了吗, 反正小扎的 Meta 是没有闲着。周六(4 月 5 日)发布了"羊驼"家族的全新版本 Llama 4 Scout 和 Llama 4 Maverick,以及两款未来会发布的 Lla
阅读全文尽管大型语言模型 在众多任务中展现出卓越的性能,但我们对其内部推理机制的理解仍然十分有限。Anthropic 研究团队提出:若我们无法深入了解 AI 如何 “得出结论” ,便难以有效评估其可靠性。为了
阅读全文加州大学圣地亚哥分校认知科学系最新的研究表明,OpenAI 的 GPT-4.5 在图灵测试中表现出色,让大量人类参与者误以为其为真人,73% 的时间被判定为人类——表现优于人类。大语言模型终于通过图灵
阅读全文这两年,大家的目光几乎被“大模型”三个字牢牢吸住了,谁超越了谁、榜单排名第一,少有人关注模型之外的东西。直到 Deepseek 用非常低的成本训练出能和 OpenAI 媲美的模型,这一下子“打醒”了很
阅读全文大家好,我是小瑶,今天是你们的 AI 前排吃瓜 + 技术解读博主。昨天人在百度科技园,参加了百度 AI DAY 活动,不仅吃到了「文小言」的一手大瓜,还非常荣幸的采访到了语音技术大牛——百度语音首席架
阅读全文大家好,我是小瑶,你们的 AI 前排吃瓜 + 深度解读博主,今天人在中关村论坛——还记得之前眼馋 OpenAI 那个死贵死贵的 Deep Research 吗?一个月 200 美刀,还得翻山越岭才能用
阅读全文这周谷歌 Gemini 2.5 Pro 和 Deepseek V3-0324 相继发布,成为了这两天讨论最多的两个模型。但是,这俩模型发布的风格却迥然不同。Gemini 2.5 Pro ,以一种“屠榜
阅读全文这两年,AI 领域最激动人心的进展莫过于大型语言模型(LLM)的崛起,LLM 展现了惊人的理解和生成能力。在此基础上,一个更宏伟的构想应运而生:构建多智能体系统(Multi-Agent System,
阅读全文昨天,DeepSeek 在毫无预告的情况下,悄悄上线了 DeepSeek-V3-0324——看似“小版本更新”的模型,经过一天的发酵,已经引发了一波地震。但我没想到的是,就在刚刚,发生了一波真的地震—
阅读全文AI 圈的“顶流”Andrej Karpathy 在 X 上发了一条动态,彻底炸了锅。这位前特斯拉 AI 负责人、OpenAI 联合创始人,用一贯的轻松语气提出一个新概念:“有一种新的编程方式我称之为
阅读全文今天,笔者受邀来到了百度科技园,参加百度 AI 开放日活动——这次主角是“秒哒”。Manus 一码难求和复现热潮还没过,没想到,百度秒哒来踢馆了!而且宣布,这次是正式全量上线。去年 11 月在百度世界
阅读全文最近在推特上刷到一条视频,特别火爆,彻底把我看呆了。请看视频效果——Prompt: 在 blender 中创建一个龙站在一堆金币旁边的场景。确保照明活泼有趣,整体效果精致。使用适当的材质,使最终渲染效
阅读全文最近刷信息流的时候,被一个东西笑喷了——“母猪产后护理难,问腾讯元宝”没错,就是那个腾讯的 AI 产品——元宝。。。它的广告就这么直白地刷在农村的墙上,还是这么接地气儿的标语。好家伙,以后养猪都不用叫
阅读全文等了好久,谷歌终于开放了 Gemini 2.0 的原生绘图能力。其实,Gemini 2.0 系列模型早在2024 年 12 月 就正式发布了,是谷歌首次支持原生多模态输出的版本(文本、图像、音频),但
阅读全文潞晨科技正式推出 Open-Sora 2.0—— 一款全新开源的 SOTA 视频生成模型,仅 20 万美元(224 张 GPU)成功训练商业级 11B 参数视频生成大模型。开发高性能的视频生成模型通常
阅读全文最近发现了个"活久见"的东西,就是下面这个~你觉得它是什么?一辆公交车?一个测试仪器?都不是,这是一台计算机。不是硅基电脑,是碳基电脑!里面装的是人类、活着的、脑皮层细胞。它叫 CL1,是澳大利亚团队
阅读全文最近刷小红书、B 站总是能看到一些奇奇怪怪又可爱到炸的东西。有人把猫咪变成挂件,有人把偶像挂在包上,一切都能变成可爱挂件,就像这样——从心爱的爱豆到动漫里的纸片人,都被“封印”进了可爱的挂件里。这股风
阅读全文jrm!稚晖君这次真的放大招了!昨天稚晖君就神秘预告今天会有惊喜,没想到惊喜程度远超想象!稚晖君所在的智元 X-Lab 正式上线了史上最复杂的具身智能项目——灵犀 X2!发布前,官方先是放出“烟雾弹”
阅读全文ChatGPT 平地一声雷,打乱了很多人、很多行业的轨迹和节奏。这两年模型发布的数量更是数不胜数,其中文本大模型就占据了 AIGC 赛道的半壁江山。关注我的家人们永远都是抢占 AI 高地的冲锋者。所以
阅读全文昨天刷family群家人的消息的时候,一条“显眼包”消息吸引了我——这是啥啊?点进去一看——「群聊精华总结」真的特别需要,尤其是对于我这种每天对接各种群各种需求消息回不完的人——仔细看一下这份「群聊精
阅读全文上周末,脖子突然抽筋坏了,比落枕难受100倍。所以停更了几天。做了CT,做了核磁,开了膏药,也开了口服药,这两天能动弹了。一夜之间,被“中国团队做的通用 AI Agent 产品”——Manus刷屏了。
阅读全文DeepSeek 的火爆,催生出了大量本地部署 DeepSeek 的需求和业务。比如你在淘宝上搜“DeepSeek 部署”,有大量关键词“DeepSeek 远程部署 搭建知识库 本地部署”等等,已然发
阅读全文今天是 DeepSeek 开源第四天,我已经感觉像是陪着那帮搞 AI 的朋友,连轴跑了四场技术马拉松,还是冲刺跑的那种。我那几个在大厂里搞 AI 的朋友,消息永远是‘在忙’、‘稍等’,好不容易逮着一个
阅读全文最近我在研究怎么让 AI 更"懂我"。不是说它不够好,DeepSeek 的能力确实很强。但每次问它问题,总觉得少了点默契。比如我想让它帮我写文案,要反复强调"用轻松的语气"、“别太正式”;让它帮我整理
阅读全文