夕小瑶科技说

o3视觉推理，暴打了Gemini 2.5 Pro和Claude 3.7 Thinking
作者：夕小瑶科技说发布日期：2025-04-18 17:18:02
今天凌晨，OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台，称 o3 的智能达到和接近天才水平。而且还有人说，OpenAI 这次又重回王座。当然，从官方放出来的榜单结果看，
阅读全文
o3和o4-mini双模登场！首次加入图片推理、工具调用
作者：夕小瑶科技说发布日期：2025-04-17 10:21:35
在今天凌晨的线上发布会上，OpenAI 一次推出两款全新模型 o3 与 o4‑mini ，并宣布它们立即向 ChatGPT Plus、Pro 与 Team 订阅者开放，引入了可直接“用图片思考”的多模
阅读全文
人类活一百年，处理的信息只有 4GB？大脑处理速度只有果蝇的16倍
作者：夕小瑶科技说发布日期：2025-04-16 20:19:22
家人们！最近奶茶发现一篇看起来非常有意思的论文！你们有没有想过，咱们的大脑一辈子到底能“装”下多少知识？最近，加州理工学院算出了人类学习的“终极天花板”——就算你是个卷王之王，24 小时不眠不休、过目
阅读全文
智谱发布国内最快的推理模型！效果比肩 DeepSeek R1，速度快 8 倍，高达 200 Tokens/s
作者：夕小瑶科技说发布日期：2025-04-15 10:06:22
我发现，AI 领域的竞争越来越多元化了。以前，大家往往比拼模型的参数规模、模型效果；后来，大家开始卷价格；就在今天，智谱 AI 这位老哥，突然开源了一个速度起飞的推理模型，直接把“速度”这张牌打成了王
阅读全文
刚刚体验完Gemini 2.5 Pro加持的Deep Research，我觉得可以扔掉OpenAI了
作者：夕小瑶科技说发布日期：2025-04-10 19:38:41
最近，谷歌不管是大模型，还是产品，上新的动作都有点频繁。。。昨天，他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro。Gemini 2.5 Pro，就
阅读全文
Llama 4 大战 DeepSeek V3，全错翻车，我人都傻了
作者：夕小瑶科技说发布日期：2025-04-08 19:00:04
大家假期休息了吗，反正小扎的 Meta 是没有闲着。周六(4 月 5 日)发布了"羊驼"家族的全新版本 Llama 4 Scout 和 Llama 4 Maverick，以及两款未来会发布的 Lla
阅读全文
Anthropic最新研究报告：跟踪Claude内部“推理”过程
作者：夕小瑶科技说发布日期：2025-04-05 10:00:00
尽管大型语言模型在众多任务中展现出卓越的性能，但我们对其内部推理机制的理解仍然十分有限。Anthropic 研究团队提出：若我们无法深入了解 AI 如何 “得出结论” ，便难以有效评估其可靠性。为了
阅读全文
AI逆袭，GPT4.5 通过了图灵测试！比真人还会骗人
作者：夕小瑶科技说发布日期：2025-04-04 11:36:14
加州大学圣地亚哥分校认知科学系最新的研究表明，OpenAI 的 GPT-4.5 在图灵测试中表现出色，让大量人类参与者误以为其为真人，73% 的时间被判定为人类——表现优于人类。大语言模型终于通过图灵
阅读全文
站在开源拐点，深度学习框架亟需一场价值重估
作者：夕小瑶科技说发布日期：2025-04-02 15:08:10
这两年，大家的目光几乎被“大模型”三个字牢牢吸住了，谁超越了谁、榜单排名第一，少有人关注模型之外的东西。直到 Deepseek 用非常低的成本训练出能和 OpenAI 媲美的模型，这一下子“打醒”了很
阅读全文
百度全新语音语言大模型发布！实时通话延迟卷至1秒，还公开了技术细节
作者：夕小瑶科技说发布日期：2025-04-01 17:51:07
大家好，我是小瑶，今天是你们的 AI 前排吃瓜 + 技术解读博主。昨天人在百度科技园，参加了百度 AI DAY 活动，不仅吃到了「文小言」的一手大瓜，还非常荣幸的采访到了语音技术大牛——百度语音首席架
阅读全文
终于等到免费且开源的DeepResearch！智谱发布AutoGLM沉思，操纵电脑搞科研太玄幻了
作者：夕小瑶科技说发布日期：2025-03-31 11:52:27
大家好，我是小瑶，你们的 AI 前排吃瓜 + 深度解读博主，今天人在中关村论坛——还记得之前眼馋 OpenAI 那个死贵死贵的 Deep Research 吗？一个月 200 美刀，还得翻山越岭才能用
阅读全文
Gemini-2.5-Pro 大战 Deepseek-V3-0324
作者：夕小瑶科技说发布日期：2025-03-30 11:49:36
这周谷歌 Gemini 2.5 Pro 和 Deepseek V3-0324 相继发布，成为了这两天讨论最多的两个模型。但是，这俩模型发布的风格却迥然不同。Gemini 2.5 Pro ，以一种“屠榜
阅读全文
Multi-Agents 系统太难搞了，不要轻易尝试 | UC Berkeley 论文分享
作者：夕小瑶科技说发布日期：2025-03-27 22:03:26
这两年，AI 领域最激动人心的进展莫过于大型语言模型（LLM）的崛起，LLM 展现了惊人的理解和生成能力。在此基础上，一个更宏伟的构想应运而生：构建多智能体系统（Multi-Agent System,
阅读全文
半夜真地震了！DeepSeek V3新版本，官方发布跑分，击溃 GPT-4.5、Claude-3.7
作者：夕小瑶科技说发布日期：2025-03-26 03:07:32
昨天，DeepSeek 在毫无预告的情况下，悄悄上线了 DeepSeek-V3-0324——看似“小版本更新”的模型，经过一天的发酵，已经引发了一波地震。但我没想到的是，就在刚刚，发生了一波真的地震—
阅读全文
Andrej Karpathy一条动态炸了！提出新概念引发400万人围观
作者：夕小瑶科技说发布日期：2025-03-25 09:10:00
AI 圈的“顶流”Andrej Karpathy 在 X 上发了一条动态，彻底炸了锅。这位前特斯拉 AI 负责人、OpenAI 联合创始人，用一贯的轻松语气提出一个新概念：“有一种新的编程方式我称之为
阅读全文
人人都是程序员的时代来了！百度秒哒全量上线，零代码开发应用的搞钱神器？
作者：夕小瑶科技说发布日期：2025-03-24 18:46:33
今天，笔者受邀来到了百度科技园，参加百度 AI 开放日活动——这次主角是“秒哒”。Manus 一码难求和复现热潮还没过，没想到，百度秒哒来踢馆了！而且宣布，这次是正式全量上线。去年 11 月在百度世界
阅读全文
手把手教你用 MCP 连接 Claude3.7 与 Blender，一句话生成 3D 场景
作者：夕小瑶科技说发布日期：2025-03-19 10:27:34
最近在推特上刷到一条视频，特别火爆，彻底把我看呆了。请看视频效果——Prompt: 在 blender 中创建一个龙站在一堆金币旁边的场景。确保照明活泼有趣，整体效果精致。使用适当的材质，使最终渲染效
阅读全文
“母猪产后护理，问腾讯元宝”，AI的广告已打进农村
作者：夕小瑶科技说发布日期：2025-03-17 20:54:32
最近刷信息流的时候，被一个东西笑喷了——“母猪产后护理难，问腾讯元宝”没错，就是那个腾讯的 AI 产品——元宝。。。它的广告就这么直白地刷在农村的墙上，还是这么接地气儿的标语。好家伙，以后养猪都不用叫
阅读全文
Gemini 2.0 原生绘画能力惊艳我了，兑现了我对 GPT-4o 曾经的幻想！
作者：夕小瑶科技说发布日期：2025-03-14 08:00:00
等了好久，谷歌终于开放了 Gemini 2.0 的原生绘图能力。其实，Gemini 2.0 系列模型早在2024 年 12 月就正式发布了，是谷歌首次支持原生多模态输出的版本（文本、图像、音频），但
阅读全文
开源11B视频生成模型，表现媲美主流闭源模型！权重+代码全流程公开
作者：夕小瑶科技说发布日期：2025-03-13 11:47:11
潞晨科技正式推出 Open-Sora 2.0—— 一款全新开源的 SOTA 视频生成模型，仅 20 万美元（224 张 GPU）成功训练商业级 11B 参数视频生成大模型。开发高性能的视频生成模型通常
阅读全文
仅5分钟学会游戏，效率远超深度强化学习！第一台活体细胞计算机诞生
作者：夕小瑶科技说发布日期：2025-03-13 11:47:11
最近发现了个"活久见"的东西，就是下面这个~你觉得它是什么？一辆公交车？一个测试仪器？都不是，这是一台计算机。不是硅基电脑，是碳基电脑！里面装的是人类、活着的、脑皮层细胞。它叫 CL1，是澳大利亚团队
阅读全文
百万年轻人"抽象"创作，AI二次元社区「狸谱」凭啥火出圈
作者：夕小瑶科技说发布日期：2025-03-12 19:44:19
最近刷小红书、B 站总是能看到一些奇奇怪怪又可爱到炸的东西。有人把猫咪变成挂件，有人把偶像挂在包上，一切都能变成可爱挂件，就像这样——从心爱的爱豆到动漫里的纸片人，都被“封印”进了可爱的挂件里。这股风
阅读全文
鸽了两年放大招！稚晖君发布灵犀X2，上演“自行车杂技”+“葡萄缝针”神技，比人还会演
作者：夕小瑶科技说发布日期：2025-03-11 15:25:14
jrm！稚晖君这次真的放大招了！昨天稚晖君就神秘预告今天会有惊喜，没想到惊喜程度远超想象！稚晖君所在的智元 X-Lab 正式上线了史上最复杂的具身智能项目——灵犀 X2！发布前，官方先是放出“烟雾弹”
阅读全文
1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区？
作者：夕小瑶科技说发布日期：2025-03-10 21:21:15
ChatGPT 平地一声雷，打乱了很多人、很多行业的轨迹和节奏。这两年模型发布的数量更是数不胜数，其中文本大模型就占据了 AIGC 赛道的半壁江山。关注我的家人们永远都是抢占 AI 高地的冲锋者。所以
阅读全文
我花了5分钟，成功部署阿里QwQ-32B，秒出的感觉太爽了
作者：夕小瑶科技说发布日期：2025-03-08 09:00:00
昨天刷family群家人的消息的时候，一条“显眼包”消息吸引了我——这是啥啊？点进去一看——「群聊精华总结」真的特别需要，尤其是对于我这种每天对接各种群各种需求消息回不完的人——仔细看一下这份「群聊精
阅读全文
为什么Manus火了
作者：夕小瑶科技说发布日期：2025-03-06 19:02:37
上周末，脖子突然抽筋坏了，比落枕难受100倍。所以停更了几天。做了CT，做了核磁，开了膏药，也开了口服药，这两天能动弹了。一夜之间，被“中国团队做的通用 AI Agent 产品”——Manus刷屏了。
阅读全文
DeepSeek带火的开源工具Ollama被曝有安全风险，你的DeepSeek可能正在被人白嫖
作者：夕小瑶科技说发布日期：2025-03-06 19:02:37
DeepSeek 的火爆，催生出了大量本地部署 DeepSeek 的需求和业务。比如你在淘宝上搜“DeepSeek 部署”，有大量关键词“DeepSeek 远程部署搭建知识库本地部署”等等，已然发
阅读全文
2024图灵奖揭晓！强化学习之父Richard Sutton与导师Andrew Barto荣膺桂冠
作者：夕小瑶科技说发布日期：2025-03-05 21:00:58
阅读全文
DeepSeek 开源第 4 天：梁文峰亲自带队，给大模型优化并行策略
作者：夕小瑶科技说发布日期：2025-02-27 18:42:24
今天是 DeepSeek 开源第四天，我已经感觉像是陪着那帮搞 AI 的朋友，连轴跑了四场技术马拉松，还是冲刺跑的那种。我那几个在大厂里搞 AI 的朋友，消息永远是‘在忙’、‘稍等’，好不容易逮着一个
阅读全文
原来在千帆上玩儿DeepSeek这么野，我终于把DeepSeek捏成我想要的样子
作者：夕小瑶科技说发布日期：2025-02-26 19:29:17
最近我在研究怎么让 AI 更"懂我"。不是说它不够好，DeepSeek 的能力确实很强。但每次问它问题，总觉得少了点默契。比如我想让它帮我写文案，要反复强调"用轻松的语气"、“别太正式”；让它帮我整理
阅读全文