机智流

MolmoAct2：为真实世界部署而生的开放动作推理模型
作者：机智流发布日期：2026-05-13 22:30:00
图片由 AI 生成机器人控制领域一直追求能适应各种任务的通用控制器，而视觉-语言-动作模型正是这一方向的关键技术。然而，现有系统在实际部署中仍面临诸多挑战：顶尖模型多为闭源；开源替代方案又往往依赖于昂
阅读全文
吞吐量提升5.66倍！微软、港中大等Spin框架如何统一稀疏注意力与分级内存，让稀疏注意力算法真正高效落地
作者：机智流发布日期：2026-05-12 21:00:00
图片由 AI 生成随着大语言模型（LLM）的上下文窗口不断扩展，从数十万词元迈向百万级别，一个核心的挑战日益凸显：模型推理时，用于存储注意力计算中间状态的关键值（KV）缓存会线性增长，这给GPU内存容
阅读全文
从尝鲜到规模化：OpenAI 总结了企业 AI 落地的 5 个关键动作
作者：机智流发布日期：2026-05-11 22:30:00
过去一年，很多公司都在问：我们是不是该上 AI？现在这个问题已经不够用了。更准确的问题应该是：我们有没有能力承接 AI？上 AI 很简单，先买账号，开权限，拉一个群，组织几场 prompt 培训。老板
阅读全文
多模态大模型“找茬”能力大考：DiffCap-Bench全面评测揭示模型短板，解锁图像编辑新可能
作者：机智流发布日期：2026-05-10 22:07:57
在数字图像编辑日益普及的今天，无论是专业设计师还是普通用户，都常常需要对两张图片进行精细的对比。例如，检查一张海报修改前后的细微差别，或者理解一张产品图在调整了哪些细节后变得更具吸引力。准确描述两张图
阅读全文
打破垄断！华南理工等团队发布首个大规模多镜头视频生成数据集，推动视频生成迈向工业级应用
作者：机智流发布日期：2026-05-09 23:59:00
图片由 AI 生成从单镜头到电影叙事：MuSS数据集如何推动多镜头视频生成在专业影视制作、广告创意和短视频内容中，视觉叙事从来不是孤立的单镜头展示。一个完整的故事往往由多个镜头序列构成：从交代环境的大
阅读全文
Agent真的能完成入职办理这样的跨系统真实业务吗？港中文等团队提出Claw-Eval-Live，让Agent评测在多个系统里把业务真的跑完
作者：机智流发布日期：2026-05-08 20:30:00
> 本文来自社区投稿导读：先说结论Claw-Eval-Live 不是简单把 Claw-Eval 扩大一圈，而是在回答另一个更现实的问题：当 Agent 的能力开始接近部署边界时，评测基准不能只测“模型
阅读全文
从数据补充到知识蒸馏：一次自我认知微调的优化实践
作者：机智流发布日期：2026-05-07 20:30:00
> 作者：李剑锋1. 前言1.1 前情回顾在上一节课中，我们通过 QLoRA 算法，将 swift 团队开源的自我认知数据集与基于 qwen3-32B 蒸馏得到的日常对话数据集（带思考）结合起来，完成
阅读全文
机器人决策新范式：港大&小鹏机器人提出DIAL，让AI机器人“想清楚”再动手，效率提升10倍
作者：机智流发布日期：2026-05-06 21:30:00
图片由 AI 生成在机器人执行“把桌上的苹果放进篮子里”这样的指令时，我们期望它不仅能“看到”苹果和篮子，更能“理解”任务目标，并规划出一系列连贯的抓取、移动、放置动作。近年来，借助强大的预训练视觉-
阅读全文
YC CEO：现在的 AI 是它有史以来最糟糕的版本｜机智流 AI 日报 5/4
作者：机智流发布日期：2026-05-05 09:42:59
SMARTFLOW · AI DAILY · 05/04「现在的 AI 是它有史以来最糟糕的版本。」— Garry Tan（YC CEO）5-4 转发的一段评论2026-05-04 · 第 125 期
阅读全文
月活 3 万也要关：AI 公司只剩两条赚钱路｜机智流 AI 日报 5/3
作者：机智流发布日期：2026-05-04 09:59:36
SMARTFLOW · AI DAILY · 05/03月活 3 万也要关，AI 公司只剩两条赚钱路。2026-05-03 · 第 124 期 · 精选 3 条值得读5-3 在 swyx 主办的 AI
阅读全文
Sam Altman：旧岗会消失，新岗会涌现｜机智流 AI 日报 5/2
作者：机智流发布日期：2026-05-03 09:28:17
SMARTFLOW · AI DAILY · 05/02「旧岗会消失，新岗会涌现。」— Sam Altman5-2 GPT-5.5 派对日 · 一条推文回复2026-05-02 · 第 123 期 ·
阅读全文
Karpathy：LLM 不只是加速旧工作｜机智流 AI 日报 5/1
作者：机智流发布日期：2026-05-02 11:34:24
SMARTFLOW · AI DAILY · 05/01「LLM 不只是在加速已有的东西，是在打开几条全新的地平线。」— Andrej Karpathy4-29 Sequoia Ascent 2026
阅读全文
4月AI月报｜各领风骚数十天｜AI 厂商的军备竞赛 30 天
作者：机智流发布日期：2026-05-01 18:12:24
机智流 · 4 月 AI 月报各领风骚数十天AI 厂商的军备竞赛 30 天825 条头条 · 8 个新前沿模型 · 3 把 SDK · 4 家同日入场安全 Agent2026 年 4 月，一位没受过高
阅读全文
从 LoRA 到 QLoRA：小显存环境下的大模型高效微调实践
作者：机智流发布日期：2026-04-30 20:00:00
> 作者：李剑锋前言在上节课中，我们已经基于 LoRA 微调方法，结合 swift 团队开源的自我认知数据集，完成了对 qwen3-0.6B 模型的高效参数微调实践。通过这一过程，大家初步掌握了在有限
阅读全文
硬件开发新革命：剑桥大学等机构提出首个新兴硬件内核生成基准KernelCraft，展示LLM生成汇编内核的潜力
作者：机智流发布日期：2026-04-29 22:30:00
图片由 AI 生成当我们谈论AI加速器时，通常会想到GPU或TPU。但为了追求极致的能效和吞吐量，越来越多的定制化AI加速器正在涌现。这些新兴硬件平台往往拥有独特的指令集架构，这为软件开发带来了巨大的
阅读全文
智能体推理平均降低27%功耗？伊利诺伊与密歇根大学提出KAIROS，用“上下文”实现高效节能
作者：机智流发布日期：2026-04-28 20:30:00
图片由 AI 生成在当今的AI数据中心，电力消耗已成为一个日益严峻的瓶颈。随着大语言模型从简单的单轮问答，演进到能够自主规划、调用工具、执行多轮复杂任务的“智能体”形态，其背后的计算模式发生了根本性变
阅读全文
产品经理向下，工程师向上：Claude Code 背后的 AI 职业融合
作者：机智流发布日期：2026-04-27 21:00:20
> 北辰编译今天没什么特别大的 AI 新闻。那就不追热点了，聊一段前两天听到的播客（也同步放出文字稿的中文翻译）。Lenny 采访了 Anthropic 的 Cat Wu。她负责 Claude Cod
阅读全文
Anthropic 产品团队为什么能跑得这么快 — Lenny 播客翻译
作者：机智流发布日期：2026-04-27 21:00:20
> 本文由 AI 辅助翻译，北辰校对Lenny Rachitsky，产品领域知名作者与播客主持人，主持 Lenny’s Podcast。Cat Wu 是 Anthropic 的产品负责人之一，负责
阅读全文
综述|智能体为何在复杂任务中“失忆”？中科大团队提出全新情境认知视角：智能源于对“情境”的动态管理
作者：机智流发布日期：2026-04-26 21:01:18
你是否曾遇到过这样的场景：一个能够熟练使用工具、拥有长期记忆的大语言模型智能体，在面对一个需要多步骤协调、环境动态变化的复杂任务时，却表现得像“失忆”一般，前后矛盾，甚至忘记最初的目标？这种能力与表现
阅读全文
过度思考如何毁掉你的项目
作者：机智流发布日期：2026-04-25 23:59:00
> 本文整理自外网，原文链接[1]见文末> 原作者：Kevin Lynagh当一个项目想法冒出来的时候，我通常会有两种走向：第一种：直接干。最多微调几次，但做出来往往跟想象中一模一样，很满意。第二种
阅读全文
纯文本依然能打：Deepseek-V4 VS. GPT-5.5 实测比较
作者：机智流发布日期：2026-04-24 23:25:57
> 北辰今早 GPT-5.5 还在 X 上力压 Opus 4.7 呢，下午 Deepseek-V4 就放出大招，不仅正式在网页端上线，还一次性开源了模型文件、同步了技术报告。小编评价：这才是真正的开源
阅读全文
一文带你跑通基于 Transformers 的参数高效微调：数据处理、LoRA 训练、模型合并与评估全流程实践指南
作者：机智流发布日期：2026-04-23 21:30:00
> 作者：李剑锋前言在上一节课里，我们通过使用 200 条示例数据，并结合训练参数的调整，成功实现了 Qwen3-0.6B 模型的全参数微调及测试。这一步非常有价值，因为它让我们真正走通了一次从数据准
阅读全文
淘宝今天上线AI试穿！一文揭秘如何解决行业痛点，实现高保真、低延迟、多品类的一站式试衣，极端姿势、复杂光照都不怕！
作者：机智流发布日期：2026-04-22 22:35:12
图片由AI生成对于许多线上购物者来说，无法亲身试穿衣物始终是影响购买决策的一大障碍。即便有了商品展示图、模特上身图，但服装穿在自己身上究竟是什么效果，依然是个未知数。这种不确定性常常导致退货率上升和消
阅读全文
CDIE2026 圆满收官：以 AI 生产力落地书写数字化转型新答卷
作者：机智流发布日期：2026-04-22 22:35:12
> 本文转载自 CDIE20262026 年 4 月 14 日—15 日，由华昂集团（Dot Connector）主办的第十二届 CDIE 数字化创新博览会在上海张江科学会堂圆满落幕。本届大会以 “将
阅读全文
大模型服务新范式：PipeLive突破在线流水线并行重构难题，自适应异构GPU环境，性能提升超30%
作者：机智流发布日期：2026-04-21 21:00:00
图片由 AI 生成在当前的AI服务场景中，大语言模型（LLM）的部署常常面临一个核心难题：如何在不中断服务的情况下，根据实时变化的负载动态调整模型的计算资源分配？传统的静态部署方式，一旦选定流水线并行
阅读全文
告别点云，仅凭RGB实现3D感知！四川大学等团队提出双手机器人操控新范式，让机器人‘看懂’3D世界
作者：机智流发布日期：2026-04-20 21:00:00
图片由 AI 生成在精密装配线上，一个机器人需要同时用两只“手”拿起细小的零件，在三维空间中精准对齐并完成组装。在家庭环境中，另一个机器人可能需要双手协作，平稳地端起一个盛满水的盘子。这些看似简单的任
阅读全文
推理速度提升7.5倍！英伟达发布Nemotron 3 Super技术报告：1200亿参数混合专家模型
作者：机智流发布日期：2026-04-19 21:29:09
图片由AI生成在人工智能模型规模不断膨胀的今天，如何在保持强大性能的同时，实现高效的推理部署，成为行业面临的核心挑战。模型参数量与推理成本之间的矛盾日益突出，尤其是在需要处理长上下文、进行复杂多步推理
阅读全文
在读代码之前，你该先做什么？
作者：机智流发布日期：2026-04-18 22:08:40
> 本文由 Intern-S1 等 AI 生成，机智流编辑部校对别急着打开代码接手一个新项目，大多数人的第一反应是 git clone 然后开始翻代码。但有个做了多年代码审计的工程师 Ally Pie
阅读全文
Visual Agent 是什么？最了解视觉智能体的一群人都来杭州了｜聊聊 Context Awareness 和 Visual Agent，Physical AI Camp 杭州站
作者：机智流发布日期：2026-04-17 18:04:44
「现代 AI 最让我着迷的一点是，它让我们得以用数学和哲学的方式，去触碰那些隐藏在人类互动背后的无形变量：AI 让『vibes』（氛围/感觉）变得可读、可理解。」——Vitalik Buterin，以
阅读全文
SFT 全量微调入门实战：从数据准备、训练原理到调参技巧，一篇讲清你想知道的全部内容
作者：机智流发布日期：2026-04-16 21:01:35
> 作者：李剑锋课前导读：在大模型应用中，提示词工程和 RAG 已经成为最常见的两类增强手段：一个负责优化指令表达，一个负责补充外部知识。但它们本质上都属于“输入侧控制”，只能在当前对话中临时影响模型
阅读全文