全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    告别碎片化训练:VERLTOOL开源如何塑造工具使用型LLM的强化学习

    作者:觉察流发布日期:2025-09-17 08:10:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当前LLM智能体研究困于碎片化与低效执行。VERLTOOL提出统一插件接口与异步流水线,首次实现跨数学、搜索、SQL等六

    阅读全文
  • 文章封面

    统一视角下的HPT:动态融合SFT与RL,释放LLM后训练新潜能

    作者:觉察流发布日期:2025-09-16 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 清华团队提出HPT算法,基于统一理论框架,让模型自适应融合SFT与RL,效果全面超越SOTA,小模型也能受益,工程师必备

    阅读全文
  • 文章封面

    "顿悟"会传染,94%性能跃升:SAPO如何用“共享经验”重构小模型RL训练

    作者:觉察流发布日期:2025-09-15 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 无需昂贵集群,不惧硬件异构。Gensyn AI团队的SAPO算法,让全球分散的消费级设备组成“蜂群”,通过共享解题经验,

    阅读全文
  • 文章封面

    OpenAI 论文:为什么AI宁可胡说也不说“我不知道”?

    作者:觉察流发布日期:2025-09-14 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 幻觉并非神秘故障,而是统计学习下的必然错误。本文揭示:语言模型的“胡说”,源于密度估计目标与二元评测体系的双重驱动。理解

    阅读全文
  • 文章封面

    推理的深度边界:神经网络如何在有限参数下实现多步推理?

    作者:觉察流发布日期:2025-09-13 08:14:58

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当LLM在奥赛摘金时,我们是否真正理解了它们的"推理"能力?研究者通过1dCA基准揭示:多步状态传播是真正的推理瓶颈,而

    阅读全文
  • 文章封面

    牛津&SH AI lab万字综述:Agentic RL——下一代企业级AI智能体的终极路线图

    作者:觉察流发布日期:2025-09-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当LLM从“问答机器”蜕变为“研究伙伴”,一场静默革命正在发生。Agentic RL赋予AI真正的规划、工具使用与自我进

    阅读全文
  • 文章封面

    IJRR2025|万字长文解读视觉RL在多目标操作中的痛点与ASIMO的突破

    作者:觉察流发布日期:2025-09-11 08:15:00

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对;下方简洁版播客由 ListenHub AI 生成想象这样一个场景:在工业流水线上,一台 Franka Panda 机械臂需

    阅读全文
  • 文章封面

    MCP注册中心更像DNS,而非APP Store

    作者:觉察流发布日期:2025-09-10 08:15:00

    今天看到一个新闻,MCP发布了一个注册中心介绍,详细内容:https://blog.modelcontextprotocol.io/posts/2025-09-08-mcp-registry-prev

    阅读全文
  • 文章封面

    Claude Code:极简架构 + 万字提示词 = 最强开发者智能体?

    作者:觉察流发布日期:2025-09-09 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Claude Code 凭借极简架构与精妙提示词,为开发者带来“愉悦感”十足的编程体验。本文探索其设计哲学,揭示“强得离

    阅读全文
  • 文章封面

    维度的囚笼:Embedding 检索模型无法逾越的数学边界

    作者:觉察流发布日期:2025-09-08 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Google DeepMind最新研究显示出嵌入式检索的根本性理论限制,证明即使是最先进的AI模型也受制于向量空间的数学

    阅读全文
  • 文章封面

    150秒的叙事革命:AudioStory如何用“解耦思维”重塑长篇音频生成

    作者:觉察流发布日期:2025-09-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 腾讯ARC Lab联合中科院团队提出AudioStory,通过解耦设计与端到端训练,将叙事音频生成时长从30秒提升至15

    阅读全文
  • 文章封面

    突破指令微调瓶颈:TCIA如何同时保持多样性与任务相关性

    作者:觉察流发布日期:2025-09-06 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ TCIA方法解决了指令微调的核心矛盾:多样性与任务相关性的平衡。本文探索了TCIA如何通过离散查询-约束空间的系统化探索

    阅读全文
  • 文章封面

    从"调用工具"到"思考策略":Chain-of-Agents实现智能体技术的临界点突破

    作者:觉察流发布日期:2025-09-05 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Chain-of-Agents范式实现了智能体技术的创新思考。它通过多智能体蒸馏,将协作智慧内化于单一模型,不仅性能超越

    阅读全文
  • 文章封面

    工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”

    作者:觉察流发布日期:2025-09-04 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文基于腾讯与清华的最新研究,首次从理论层面证明TIR能严格扩展模型能力边界,揭示了从“使用工具”到“与工具思考”的认知

    阅读全文
  • 文章封面

    我去面壁

    作者:觉察流发布日期:2025-09-03 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。此处2w字空白,原因如下:想看原文的朋友,可以在下面社群,找到我,已备好PDF。我去面壁了。参考资料还是不错的,依然放在了末

    阅读全文
  • 文章封面

    REQINONE:三步解构SRS,大模型如何重塑需求工程范式?

    作者:觉察流发布日期:2025-09-02 08:15:00

    击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ REQINONE通过精巧的“任务分解”策略,将LLM生成SRS的复杂过程拆解为摘要、提取与分类三步,以模块化设计实现了质量

    阅读全文
  • 文章封面

    AgentScope 1.0:从ReAct范式到生产级智能体应用的开发者中心框架

    作者:觉察流发布日期:2025-09-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AgentScope 1.0为智能体开发提供了从模块化组件到工程化支持的完整闭环,其对ReAct范式的系统性实现,标志着

    阅读全文
  • 文章封面

    从“知识断片”到“零样本推理”:AutoBnB-RAG如何赋能多智能体AI安全协作

    作者:觉察流发布日期:2025-08-31 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI安全团队陷入决策僵局,是让它盲目尝试,还是适时“求助”?AutoBnB-RAG给出了答案:一种模拟人类专家行为的“

    阅读全文
  • 文章封面

    解码50%失败率:自主智能体的三大“死穴”与破局之道

    作者:觉察流发布日期:2025-08-30 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当前一些自主智能体系统任务完成率仅50%,但失败原因不够明确。本文基于香港中文大学与新加坡管理大学的最新研究,首次系统性

    阅读全文
  • 文章封面

    工具为谁而造?AI Agentic Programming 的“元挑战”与破局

    作者:觉察流发布日期:2025-08-29 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AI编码智能体已能自主编程,但“能做”不等于“可信”。本文基于利兹大学最新综述,揭示其评估、安全、协作三大困境,并指出重

    阅读全文
  • 文章封面

    记忆即智能,无需微调LLM:Memento重新定义LLM智能体学习范式

    作者:觉察流发布日期:2025-08-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Memento提出记忆增强学习新范式,无需微调模型即可实现智能体的持续进化。通过案例记忆与Q函数学习,系统在复杂任务中提

    阅读全文
  • 文章封面

    从3000万到1777.9 Token:LogicRAG用动态逻辑图实现“零预建图的高效推理

    作者:觉察流发布日期:2025-08-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 香港理工大学团队提出LogicRAG,创新性地摒弃预建图谱,通过动态生成专属推理结构,以极低开销实现复杂问答的性能飞跃,

    阅读全文
  • 文章封面

    当AI评估遇见"专家委员会":MAJ-EVAL如何让自动化评估真正理解人类价值?

    作者:觉察流发布日期:2025-08-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统自动评估指标为何总与人类判断"脱节"?MAJ-EVAL框架通过"基于证据的角色构建"和"多智能体辩论机制",让自动化

    阅读全文
  • 文章封面

    MCP的60%成功率瓶颈:LiveMCP-101揭示AI智能体在真实场景中的失败根源

    作者:觉察流发布日期:2025-08-25 08:14:26

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LiveMCP-101基准测试揭示:即使最前沿AI智能体在真实动态场景中的任务成功率也不足60%。本文解析该研究的双轨评

    阅读全文
  • 文章封面

    OS Agents全景解析:从MLLM基础模型到个性化智能体的演进之路

    作者:觉察流发布日期:2025-08-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI能直接操作系统,人机交互的边界将被彻底重塑。本文系统梳理MLLM驱动的OS Agents技术全栈,从基础模型、框架

    阅读全文
  • 文章封面

    记忆增强型Transformer:从神经科学原理到技术解决方案的三维解析(1.5w字)

    作者:觉察流发布日期:2025-08-23 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文基于最新系统性综述,以神经科学为镜,全面解析记忆增强Transformer的演进路径,揭示其从智能缓存到类脑认知架构

    阅读全文
  • 文章封面

    微软 Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”

    作者:觉察流发布日期:2025-08-22 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当AI Agent的复杂性与强化学习的工程难度碰撞,开发者陷入了重写逻辑的泥潭。微软研究团队提出的Agent Light

    阅读全文
  • 文章封面

    GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类(万字)

    作者:觉察流发布日期:2025-08-21 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 一项覆盖31K图像的实证研究,为GPT-5的空间智能能力画出精确坐标。它在简单任务上遥遥领先,却在复杂挑战前与开源模型并

    阅读全文
  • 文章封面

    记忆即推理:ComoRAG的认知循环如何重塑长文本理解

    作者:觉察流发布日期:2025-08-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在长篇叙事的迷宫中,AI如何像人类一样“记住”线索、更新认知?ComoRAG通过模拟大脑前额叶的元认知循环,以动态记忆破

    阅读全文
  • 文章封面

    经验即代码:SWE-Exp框架如何将过往修复转化为可执行的智能资产(万字)

    作者:觉察流发布日期:2025-08-19 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在AI驱动的软件维护中,真正的突破不在于更强大的模型,而在于构建能够从历史中学习的"记忆"。SWE-Exp通过四阶段经验

    阅读全文
上一页下一页