大脑如何记忆?哈佛大学联合MIT提出「key-value 存储」理论
哈佛大学联合 MIT 提出大脑记忆遵循 “Key-value memory” 原理 —— 海马体存储用于检索的 “键”(Key),新皮质存储记忆 “值”(value),二者分工协作解决了 “记忆存得住
阅读全文哈佛大学联合 MIT 提出大脑记忆遵循 “Key-value memory” 原理 —— 海马体存储用于检索的 “键”(Key),新皮质存储记忆 “值”(value),二者分工协作解决了 “记忆存得住
阅读全文GAIR 与青年科学家共同点亮,通往真实智能的道路。作者丨郑佳美编辑丨马晓宁12 月 13 日,GAIR 2025 将以「走向真实智能的起点」为题,在深圳南山 · 博林天瑞喜来登酒店举办重磅专题论坛。
阅读全文本文修改自:https://sander.ai/2024/02/28/paradox.html扩散模型(Diffusion Models)之所以能在图像、音频、视频等领域取得统治级表现,其根本原因在于
阅读全文> 本文来自社区投稿今天要和大家聊一篇非常有意思的工作——LightReasoner。这篇由香港大学发表的最新论文,挑战了AI界一个习以为常的认知:“大模型一定比小模型强,小模型只能被教导,不能当老师
阅读全文> 本文来自社区投稿,作者:北京大学牛宇威本图由 Nano Banana Pro 生成近日,来自北京大学与港大 MMLab 等机构合作的最新研究成果——UniSandbox,深入探究了多模态大模型领域
阅读全文新闻资讯DeepSeek 强势回归:开源 IMO 金牌级数学模型 DeepSeek-Math-V2DeepSeek 发布新一代数学推理模型 DeepSeek-Math-V2,实现 IMO 金牌级推理能
阅读全文> 作者:李剑锋前言在上一节课中(零基础入门 LangChain 多智能体系统(进阶篇):加入人工审查与信息流控制),我们主要学习了如何构建多智能体系统,让大模型不仅能够“回答问题”,还能够在复杂任务
阅读全文Google DevFest,作为由 Google Developers 发起、全球 GDG 社区联合举办的年度顶级开发者盛会,2025年将再度登陆广州(国际)科技成果转化天河基地。本次“天创工坊·G
阅读全文本图由 Nano Banana Pro 生成引言:具身智能的“两难困境”与行业期待当我们幻想未来机器人能像人类一样灵活应对家居清洁、工业装配、医疗辅助等复杂场景时,现实中的机器人却常常陷入“机械执行”
阅读全文直播简介在大模型迈向智能体(Agent)时代的关键阶段,“记忆”正成为下一代 AI 的核心分水岭。记忆张量携手多位学术界、产业界、社区合作伙伴,将在发布会上分享 原生记忆架构、生态落地实践 等多个话题
阅读全文大语言模型(LLM)正变得越来越“重”:从Llama-3.1的 8B、70B 到 405B 参数,每个尺寸都要从头训练,动辄消耗数万亿 tokens。如果能用一个模型覆盖多尺寸部署需求,不仅能大幅降低
阅读全文当黄浦江畔的科创浪潮与云原生技术革新交汇,当算力竞赛告别 "硬件堆砌" 的粗放时代,转而深耕效率提升的精细化道路 —— 上海,这座锚定中国数字经济未来的先锋城市,正迎来一场由开源力量驱动的算力效率协同
阅读全文提及小米在AI领域的布局,「MiMo」系列绝对是绕不开的关键方向。业内已经逐渐意识到:这是小米在 AI × 终端 × 机器人 × 智能汽车 四条线交汇处的核心战略资产。小米MiMo系列此前推出的MiM
阅读全文在大模型(Large Language Model, LLM)智能体的研发浪潮中,一个长期存在的瓶颈始终挥之不去:对人类标注数据的依赖。无论是基于人类反馈的强化学习(RLHF),还是基于可验证奖励的强
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://pytorch.org/blog/kernelfalcon-autonomous-gpu-kern
阅读全文(1) V-ReasonBench: Toward Unified Reasoning Benchmark Suite for Video Generation Models论文 ID:2511.16
阅读全文本文精选了美团技术团队在国际顶会NeurIPS 2025中发表的10篇论文,研究方向覆盖了大模型、多模态、自然语音处理、计算机视觉、基础技术、因果推断等技术领域,希望相关研究能给同学们带来一些帮助或启
阅读全文> 作者:李剑锋简介在上一节内容中(一个人太忙?那就让智能体组个团队!零基础入门LangChain V1.0多智能体系统),我们已经成功地搭建了一个由 Supervisor 统一协调 Calendar
阅读全文(1) Kandinsky 5.0: A Family of Foundation Models for Image and Video Generation论文 ID:2511.14993论文简介
阅读全文在机器人领域,“通用化”和“稳健性”一直是两座难攀的高峰。过去,大多数视觉-语言-动作(VLA)模型都像“温室里的花朵”——只能在预设的演示数据里“照猫画虎”,一旦遇到真实世界的变数,比如褶皱的衬衫、
阅读全文不卷算力卷效率,HAMi Meetup 上海站来啦!作为一个活跃的 CNCF 开源项目,HAMi 是目前行业内唯一专注于异构 GPU 资源共享的开源项目,通过灵活、可靠、按需、弹性的 GPU 虚拟化来
阅读全文你是否曾好奇,为何大模型对话有时“秒回”,有时却“卡顿”?这背后的关键在于LLM 服务系统如何平衡两个截然不同的推理阶段——快速但计算密集的预填充(Prefill)和缓慢但内存受限的解码(Decode
阅读全文(1) P1: Mastering Physics Olympiads with Reinforcement Learning论文 ID:2511.13612论文简介:由上海人工智能实验室等机构提出了
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明
阅读全文(1) Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds论文 ID:2511.08892论文简介:由Byt
阅读全文一句话速读:卡内基梅隆大学研究者提出 AI 伴侣四象限分类法,以 “情感型 vs 功能型”“虚拟型 vs 实体型” 为核心维度,系统梳理了从虚拟偶像、职场助手到实体护理机器人的全场景形态,揭秘了不同类
阅读全文在AI时代,我们常常幻想一个智能助手,能像人类一样熟练操作电脑:打开软件、点击按钮、编辑文档,甚至处理复杂的设计任务。然而,这个愿景的实现往往卡在“眼力”上——AI如何准确地将自然语言指令映射到屏幕上
阅读全文10 月 31 日,我们受 RTE 开发者社区邀请参加了 RTE2025 大会。这不是寻常的科技展会,没有冰冷的技术参数展示,取而代之的是AI与人类自然交流的场景。今年大会以「AI 有声」为主题,这巧
阅读全文在人工智能迅猛发展的当下,构建能够自主感知、推理并行动的通用智能体,已成为通往通用人工智能(AGI)的关键路径。然而,传统的AI智能体往往局限于封闭环境,难以应对开放世界的复杂性和不确定性。近日,字节
阅读全文> 作者:李剑锋简介在上一节课中(进阶实战!掌握 LangChain V1.0 八大中间件:从调用限制到上下文优化的全流程实战),我们学习了智能体(Agent)中间件的概念及其在任务执行过程中的作用。
阅读全文