觉察流

告别碎片化训练：VERLTOOL开源如何塑造工具使用型LLM的强化学习
作者：觉察流发布日期：2025-09-17 08:10:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当前LLM智能体研究困于碎片化与低效执行。VERLTOOL提出统一插件接口与异步流水线，首次实现跨数学、搜索、SQL等六
阅读全文
统一视角下的HPT：动态融合SFT与RL，释放LLM后训练新潜能
作者：觉察流发布日期：2025-09-16 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 清华团队提出HPT算法，基于统一理论框架，让模型自适应融合SFT与RL，效果全面超越SOTA，小模型也能受益，工程师必备
阅读全文
"顿悟"会传染，94%性能跃升：SAPO如何用“共享经验”重构小模型RL训练
作者：觉察流发布日期：2025-09-15 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 无需昂贵集群，不惧硬件异构。Gensyn AI团队的SAPO算法，让全球分散的消费级设备组成“蜂群”，通过共享解题经验，
阅读全文
OpenAI 论文：为什么AI宁可胡说也不说“我不知道”？
作者：觉察流发布日期：2025-09-14 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 幻觉并非神秘故障，而是统计学习下的必然错误。本文揭示：语言模型的“胡说”，源于密度估计目标与二元评测体系的双重驱动。理解
阅读全文
推理的深度边界：神经网络如何在有限参数下实现多步推理？
作者：觉察流发布日期：2025-09-13 08:14:58
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当LLM在奥赛摘金时，我们是否真正理解了它们的"推理"能力？研究者通过1dCA基准揭示：多步状态传播是真正的推理瓶颈，而
阅读全文
牛津&SH AI lab万字综述：Agentic RL——下一代企业级AI智能体的终极路线图
作者：觉察流发布日期：2025-09-12 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当LLM从“问答机器”蜕变为“研究伙伴”，一场静默革命正在发生。Agentic RL赋予AI真正的规划、工具使用与自我进
阅读全文
IJRR2025｜万字长文解读视觉RL在多目标操作中的痛点与ASIMO的突破
作者：觉察流发布日期：2025-09-11 08:15:00
本文由 Intern-S1、Qwen3 等 AI 生成，由机智流编辑部校对；下方简洁版播客由 ListenHub AI 生成想象这样一个场景：在工业流水线上，一台 Franka Panda 机械臂需
阅读全文
MCP注册中心更像DNS，而非APP Store
作者：觉察流发布日期：2025-09-10 08:15:00
今天看到一个新闻，MCP发布了一个注册中心介绍，详细内容：https://blog.modelcontextprotocol.io/posts/2025-09-08-mcp-registry-prev
阅读全文
Claude Code：极简架构 + 万字提示词 = 最强开发者智能体？
作者：觉察流发布日期：2025-09-09 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ Claude Code 凭借极简架构与精妙提示词，为开发者带来“愉悦感”十足的编程体验。本文探索其设计哲学，揭示“强得离
阅读全文
维度的囚笼：Embedding 检索模型无法逾越的数学边界
作者：觉察流发布日期：2025-09-08 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ Google DeepMind最新研究显示出嵌入式检索的根本性理论限制，证明即使是最先进的AI模型也受制于向量空间的数学
阅读全文
150秒的叙事革命：AudioStory如何用“解耦思维”重塑长篇音频生成
作者：觉察流发布日期：2025-09-07 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 腾讯ARC Lab联合中科院团队提出AudioStory，通过解耦设计与端到端训练，将叙事音频生成时长从30秒提升至15
阅读全文
突破指令微调瓶颈：TCIA如何同时保持多样性与任务相关性
作者：觉察流发布日期：2025-09-06 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ TCIA方法解决了指令微调的核心矛盾：多样性与任务相关性的平衡。本文探索了TCIA如何通过离散查询-约束空间的系统化探索
阅读全文
从"调用工具"到"思考策略"：Chain-of-Agents实现智能体技术的临界点突破
作者：觉察流发布日期：2025-09-05 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ Chain-of-Agents范式实现了智能体技术的创新思考。它通过多智能体蒸馏，将协作智慧内化于单一模型，不仅性能超越
阅读全文
工具集成推理（TIR）的认知革命：当大模型学会“与工具协同思考”
作者：觉察流发布日期：2025-09-04 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 本文基于腾讯与清华的最新研究，首次从理论层面证明TIR能严格扩展模型能力边界，揭示了从“使用工具”到“与工具思考”的认知
阅读全文
我去面壁
作者：觉察流发布日期：2025-09-03 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。此处2w字空白，原因如下：想看原文的朋友，可以在下面社群，找到我，已备好PDF。我去面壁了。参考资料还是不错的，依然放在了末
阅读全文
REQINONE：三步解构SRS，大模型如何重塑需求工程范式？
作者：觉察流发布日期：2025-09-02 08:15:00
击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ REQINONE通过精巧的“任务分解”策略，将LLM生成SRS的复杂过程拆解为摘要、提取与分类三步，以模块化设计实现了质量
阅读全文
AgentScope 1.0：从ReAct范式到生产级智能体应用的开发者中心框架
作者：觉察流发布日期：2025-09-01 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ AgentScope 1.0为智能体开发提供了从模块化组件到工程化支持的完整闭环，其对ReAct范式的系统性实现，标志着
阅读全文
从“知识断片”到“零样本推理”：AutoBnB-RAG如何赋能多智能体AI安全协作
作者：觉察流发布日期：2025-08-31 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当AI安全团队陷入决策僵局，是让它盲目尝试，还是适时“求助”？AutoBnB-RAG给出了答案：一种模拟人类专家行为的“
阅读全文
解码50%失败率：自主智能体的三大“死穴”与破局之道
作者：觉察流发布日期：2025-08-30 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当前一些自主智能体系统任务完成率仅50%，但失败原因不够明确。本文基于香港中文大学与新加坡管理大学的最新研究，首次系统性
阅读全文
工具为谁而造？AI Agentic Programming 的“元挑战”与破局
作者：觉察流发布日期：2025-08-29 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ AI编码智能体已能自主编程，但“能做”不等于“可信”。本文基于利兹大学最新综述，揭示其评估、安全、协作三大困境，并指出重
阅读全文
记忆即智能，无需微调LLM：Memento重新定义LLM智能体学习范式
作者：觉察流发布日期：2025-08-28 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ Memento提出记忆增强学习新范式，无需微调模型即可实现智能体的持续进化。通过案例记忆与Q函数学习，系统在复杂任务中提
阅读全文
从3000万到1777.9 Token：LogicRAG用动态逻辑图实现“零预建图的高效推理
作者：觉察流发布日期：2025-08-27 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 香港理工大学团队提出LogicRAG，创新性地摒弃预建图谱，通过动态生成专属推理结构，以极低开销实现复杂问答的性能飞跃，
阅读全文
当AI评估遇见"专家委员会"：MAJ-EVAL如何让自动化评估真正理解人类价值？
作者：觉察流发布日期：2025-08-26 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 传统自动评估指标为何总与人类判断"脱节"？MAJ-EVAL框架通过"基于证据的角色构建"和"多智能体辩论机制"，让自动化
阅读全文
MCP的60%成功率瓶颈：LiveMCP-101揭示AI智能体在真实场景中的失败根源
作者：觉察流发布日期：2025-08-25 08:14:26
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ LiveMCP-101基准测试揭示：即使最前沿AI智能体在真实动态场景中的任务成功率也不足60%。本文解析该研究的双轨评
阅读全文
OS Agents全景解析：从MLLM基础模型到个性化智能体的演进之路
作者：觉察流发布日期：2025-08-24 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当AI能直接操作系统，人机交互的边界将被彻底重塑。本文系统梳理MLLM驱动的OS Agents技术全栈，从基础模型、框架
阅读全文
记忆增强型Transformer：从神经科学原理到技术解决方案的三维解析(1.5w字)
作者：觉察流发布日期：2025-08-23 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 本文基于最新系统性综述，以神经科学为镜，全面解析记忆增强Transformer的演进路径，揭示其从智能缓存到类脑认知架构
阅读全文
微软 Agent Lightning：零代码接入RL，“解耦”任何AI Agent学会“在实践中学习”
作者：觉察流发布日期：2025-08-22 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 当AI Agent的复杂性与强化学习的工程难度碰撞，开发者陷入了重写逻辑的泥潭。微软研究团队提出的Agent Light
阅读全文
GPT-5空间智能大考：简单任务称王，复杂挑战平手，所有模型都输给了人类（万字）
作者：觉察流发布日期：2025-08-21 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 一项覆盖31K图像的实证研究，为GPT-5的空间智能能力画出精确坐标。它在简单任务上遥遥领先，却在复杂挑战前与开源模型并
阅读全文
记忆即推理：ComoRAG的认知循环如何重塑长文本理解
作者：觉察流发布日期：2025-08-20 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 在长篇叙事的迷宫中，AI如何像人类一样“记住”线索、更新认知？ComoRAG通过模拟大脑前额叶的元认知循环，以动态记忆破
阅读全文
经验即代码：SWE-Exp框架如何将过往修复转化为可执行的智能资产（万字）
作者：觉察流发布日期：2025-08-19 08:15:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 在AI驱动的软件维护中，真正的突破不在于更强大的模型，而在于构建能够从历史中学习的"记忆"。SWE-Exp通过四阶段经验
阅读全文