全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    MCP 安全之殇:智能体系统的隐忧与破局

    作者:觉察流发布日期:2025-06-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在 MCP 驱动的智能代理系统蓬勃发展的当下,我们正站在技术革新的十字路口。它带来了前所未有的交互体验,却也潜藏了不容忽

    阅读全文
  • 文章封面

    STORYWRITER:长篇故事生成的多智能体框架

    作者:觉察流发布日期:2025-06-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 文字是一切内容的起点,IP 是泛娱乐行业的宝藏。该来的总要来,AI迈进长篇故事生成领域,话语连贯性与叙事复杂性是LLM生

    阅读全文
  • 文章封面

    掌控 AI 智能体自主性:五级框架下的人机协作之道(万字)

    作者:觉察流发布日期:2025-06-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AI智能体自主性分级,是掌控其潜力与风险的关键。在AI浪潮中,如何精准校准智能体自主性,使其高效服务人类又不致失控,是需

    阅读全文
  • 文章封面

    模型合并 之 PMA 策略:大型语言模型预训练的 “加速引擎”

    作者:觉察流发布日期:2025-06-19 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型语言模型发展迅猛,但预训练成本高昂、训练不稳定等问题需要解决。本文探讨了预训练模型合并技术,尤其是 PMA 策略,为

    阅读全文
  • 文章封面

    2025年AI驱动软件开发:16款“Vibe Coding”工具盘点(2.5万字)

    作者:觉察流发布日期:2025-06-18 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文聚焦2025年AI Coding领域,解析Vibe Coding新范式,其核心是通过自然语言描述,AI辅助生成代码,

    阅读全文
  • 文章封面

    AgentRM 奖励建模:智能体泛化能力的“导航仪”与“加速器”(万字)

    作者:觉察流发布日期:2025-06-16 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AgentRM 提出三种奖励模型方法,显式奖励建模、隐式奖励建模和LLM作为裁判。AgentRM 通过创新的奖励建模和测

    阅读全文
  • 文章封面

    Agentic Neural Networks(ANN):自我演化的多智能体系统

    作者:觉察流发布日期:2025-06-13 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ ANN(Agentic Neural Networks)的核心目标是借助神经网络的原理,实现多智能体系统的自我演化,从而

    阅读全文
  • 文章封面

    强化预训练(RPT):LLM 预训练新范式,当模型学会战略思考(万字)

    作者:觉察流发布日期:2025-06-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ RPT 通过将传统的 next-token-prediction 重构为 next-token-reasoning 任务

    阅读全文
  • 文章封面

    AgentCPM-GUI:强化微调(RFT)赋能的移动设备 GUI 智能体(万字)

    作者:觉察流发布日期:2025-06-12 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在移动设备 GUI 操作领域,AgentCPM-GUI 凭借强化微调、高质量数据集与紧凑动作空间设计,突破语言壁垒,在多

    阅读全文
  • 文章封面

    LLM 智能体终身学习评估利器:LifelongAgentBench 框架(万字)

    作者:觉察流发布日期:2025-06-11 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ LifelongAgentBench,可以评估 LLM 智能体的终身学习能力哦!这是首个专门设计用于系统评估 LLM

    阅读全文
  • 文章封面

    Qwen3 嵌入与重排序(技术报告):复杂指令下的文本处理新能手(万字)

    作者:觉察流发布日期:2025-06-10 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 前些天 Qwen3 冷不丁的发布了 Embedding 让人惊喜。已经有小伙伴做了自己业务上的测试,据说挺好用,一起看看

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-06-08】

    作者:觉察流发布日期:2025-06-09 00:03:47

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 grok-2-1212” 今日趋势今天GitHub上最受关注的项目主要集中在人工智能和开发工具领域。特别

    阅读全文
  • 文章封面

    Qwen:PARSCALE 让语言模型在并行中飞跃(万字)

    作者:觉察流发布日期:2025-06-08 08:15:55

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统的参数扩展和推理时间扩展方法面临着内存和时间成本的双重困境。PARSCALE,作为一种全新的并行扩展范式,通过增加并

    阅读全文
  • 文章封面

    RL 驱动 LLM 智能体:ML-Agent 创新自主机器学习工程(万字)

    作者:觉察流发布日期:2025-06-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在机器学习工程领域,自主智能体的研究正逐渐成为焦点。ML-Agent 为这一领域带来了新思路。它凭借创新的学习型 age

    阅读全文
  • 文章封面

    ALPHAONE(α1):LRM 自适应推理效率与准确性的平衡之道

    作者:觉察流发布日期:2025-06-06 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型推理模型(LRM)正不断突破复杂推理任务的边界。然而,它们在推理过程中常常陷入过度推理或推理不足的困境。如今,ALP

    阅读全文
  • 文章封面

    论智能体互联网的崛起:智能经济性驱动的价值转移与生态重构(二万字)

    作者:觉察流发布日期:2025-06-05 08:15:00

    “ 作者简介:侯宏,北京大学国家发展研究院管理学助理教授,承泽企业家研修项目学术主任,剑桥大学博士。在攻读博士学位前,在国内高科技行业有近十年工作经验,在多家公司历任咨询顾问、战略经理、战略部总经理、

    阅读全文
  • 文章封面

    NVIDIA 新成果:ProRL 拓展 LLM 推理边界(万字)

    作者:觉察流发布日期:2025-06-05 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ ProRL 方法通过长时间稳定训练与多样化任务组合,有效引导模型探索新推理路径,使 Nemotron-Research-

    阅读全文
  • 文章封面

    定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL(万字)

    作者:觉察流发布日期:2025-06-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Synthetic Data RL 为我们提供了一种新的解决方案。它仅凭任务定义,就能生成合成数据并进行强化学习训练,无

    阅读全文
  • 文章封面

    MARFT:多智能体协作与强化学习微调的协同进化(万字)

    作者:觉察流发布日期:2025-05-31 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ MARFT(Multi-Agent Reinforcement Fine-Tuning)作为一种新兴技术,正以其独特的优

    阅读全文
  • 文章封面

    当异常奖励遇上 AI 推理:一场意料之外的智力提升(万字)

    作者:觉察流发布日期:2025-05-29 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当随意的奖励信号仍可以大幅提升模型性能,就得重新思考:到底RL是在学习,还是在放大某种“先验”行为。” 大家好,我是肆〇

    阅读全文
  • 文章封面

    奖励推理模型(RRM):革新奖励模型的新范式(万字)

    作者:觉察流发布日期:2025-05-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Post-train 技术中的reward model(奖励模型)扮演着至关重要的角色。然而,传统奖励模型在利用测试时计

    阅读全文
  • 文章封面

    MMaDA:多模态大型扩散语言模型的创新突破(万字)

    作者:觉察流发布日期:2025-05-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架

    阅读全文
  • 文章封面

    DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章(万字)

    作者:觉察流发布日期:2025-05-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的

    阅读全文
  • 文章封面

    混合推理模型(LHRM):平衡效率与推理能力的新范式

    作者:觉察流发布日期:2025-05-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在 AI 领域,大型推理模型(LRM)已逐步普及。然而,这些模型在实际应用中却暴露出过度思考的问题。所以,大型混合推理模

    阅读全文
  • 文章封面

    字节跳动 AdaCoT:基于强化学习的自适应推理触发方法(万字)

    作者:觉察流发布日期:2025-05-25 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在人工智能领域,大型语言模型(LLM)正以前所未有的速度发展。然而,这些模型在处理复杂推理任务时仍面临诸多挑战,如数学问

    阅读全文
  • 文章封面

    Microsoft 推出 Magentic-UI:网页多智能体,革新式人机协作(万字)

    作者:觉察流发布日期:2025-05-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 微软推出 Magentic-UI,一款开源人机协作神器。它能让用户与 AI 共同规划和执行任务,关键操作前还会寻求用户许

    阅读全文
  • 文章封面

    Thinkless框架:让LLM学会“聪明偷懒”的智慧

    作者:觉察流发布日期:2025-05-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 新加坡国立大学的 Thinkless 框架,让 LLM 学会 “偷懒”,在简单问题上不再过度思考,效率提升高达 90%。

    阅读全文
  • 文章封面

    Anthropic 发布 Claude 4:为开发者带来的全新编程体验与机遇

    作者:觉察流发布日期:2025-05-23 08:25:07

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。 大家好,我是肆〇柒。Anthropic公司于2025年5月23日推出的Claude 4模型,它以卓越的编程能力和推理性能,

    阅读全文
  • 文章封面

    AdaptThink:推理模型的自适应思考范式

    作者:觉察流发布日期:2025-05-23 08:25:07

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。

    阅读全文
  • 文章封面

    LLM 协作革命:Group Think 如何重塑推理边界 (万字)

    作者:觉察流发布日期:2025-05-22 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 让一个模型拥有多个“智慧大脑”会有多强大?Group Think 现在让单个 LLM 模拟多个并行推理智能体,推理速度提

    阅读全文
上一页下一页