创新Transformer!面壁基于稀疏-线性混合架构SALA训练9B模型,端侧跑通百万上下文
9B模型实现端侧百万上下文推理,比同尺寸模型速度最高提升 3.5 倍。众所周知,Transformer 及其核心的全注意力机制(Full Attention)虽长期占据大模型架构的核心地位,但平方级
阅读全文9B模型实现端侧百万上下文推理,比同尺寸模型速度最高提升 3.5 倍。众所周知,Transformer 及其核心的全注意力机制(Full Attention)虽长期占据大模型架构的核心地位,但平方级
阅读全文QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。作者丨郑佳美编辑丨岑 峰在多步时间序列预测任务中,预测性能随时间步长迅速退化几乎成为一种共识。例如:在气象预测中,
阅读全文这套高效、稳健的 Active Perception 架构,为下一代通用多模态模型指明了方向。
阅读全文创作只需1%的灵感,我们负责100%的放大。 作者丨成妍菁 编辑丨董子博当下AI圈几乎每周都有新鲜事发生,这反而给了许多创业公司熬出头的机会,无论是Clawedbot掀起对物理世界交互方式的重构,还
阅读全文医疗大模型正在经历从“聊天工具”向“生命基础设施”的硬核进化。2024年以来,生成式AI席卷全球,医疗健康被公认为最具社会价值、也是门槛最高的应用场景。从早期的医学影像辅助诊断,到如今大语言模型(LL
阅读全文可灵3.0上线,AI视频创作进入影视级导演时代。近日消息,可灵AI正式全球上线3.0系列模型,目前正面向黑金、钻石、铂金会员开放使用,预计将于近期全量上线。此次发布的可灵视频3.0、可灵视频3.0 O
阅读全文InfLLM-V2:通过最小结构扰动,实现大模型从短上下文到长上下文的平滑升级。作者丨郑佳美编辑丨岑峰在大语言模型快速迈向更强推理能力与更复杂应用场景的过程中,“上下文长度”已经从一个模型配置参数,演
阅读全文在科学、临床与产业的共振中,寻找脑机接口的确定性。作者丨岑峰2024年初,马斯克旗下Neuralink宣布其首位人类受试者成功实现“意念控鼠”,随后更传出将于2026年开启大规模量产的消息。这一系列进
阅读全文桥介数物要做的不只是运动控制本身,而是一个开发工具,一个平台。作者丨高景辉编辑丨马晓宁 “只要你做硬件,我们就投你。”在深圳南山的一间办公室内,一位投资人向面前的年轻人开出了一个诱人的条件。但令投资人
阅读全文强化学习改变了模型组织技能的方式,而非简单提升指标。作者丨郑佳美编辑丨岑峰随着大语言模型规模和预训练强度的不断提升,强化学习在后训练阶段的角色正在发生微妙变化。一方面,它仍然是当前提升模型推理能力和多
阅读全文AGI 的路怎么走?阶跃星辰的答案是“以巧见大,唯快不破”。作者丨董子博编辑丨林觉民就在昨天,阶跃星辰登顶了全球模型榜单——他们最新开源的 Agent 基座模型 Step 3.5 Flash,发布首
阅读全文这项基于 UK Biobank 的研究显示,人工智能结合血液多组学信息,可系统评估未来 15 年多种心血管疾病的发生风险。作者丨郑佳美编辑丨岑峰在心血管疾病预防中,一个长期存在的难题是:许多疾病在发病
阅读全文超越 Sora 2,Vidu Q3 位居全球第二、中国第一。作者丨王晓然编辑丨马晓宁快过春节了,来整一个花活儿,想看灭霸和复仇者联盟成员一起放烟花。这段视频是在 Vidu Q3 中,仅用一段 Pro
阅读全文一个因为自主进化 Bot 插件 引发的“罗生门”,离离原上谱。 作者丨胡家铭 编辑丨董子博 林觉民2 月 2 日下午,独立开发者、 AI游戏公司 AutoGame 创始人张昊阳收到了一封令人错愕的邮
阅读全文上海交大智能计算研究院提出 StepORLM,通过生成式过程监督提升运筹建模的整体可靠性。作者丨郑佳美编辑丨岑峰在大语言模型逐步从通用推理工具走向专业领域应用的过程中,运筹优化(OR)成为一个极具吸引
阅读全文ICLR 2026 - ReMix:一个通用且易实现的大模型强化学习高效后训练微调方法。
阅读全文过去一年,具身智能行业融资多达370起,累计金额419.29亿人民币。作者丨马晓宁自动驾驶行业已经成为了具身智能创业者最大来源地之一,这其中主要有两个原因:其一,自动驾驶赛道已经全面收敛,无论是技术还
阅读全文作为具身智能触达物理世界的“第一步”,导航技术正处于从“几何避障”向“空间智能”跨越的历史性拐点。如果说大语言模型赋予了 AI 思考的“灵魂”,那么具身智能则致力于为 AI 打造行动的“身体”。在这一
阅读全文带你理清这篇里程碑式论文的逻辑框架,看物理法则如何为 AI 赋予“灵魂”与“解释力”。当复杂的社会系统遇见严谨的物理定律,当海量的社交数据碰撞强大的深度学习,一个新兴的交叉领域——社会物理学引导的深度
阅读全文又一智驾“老兵”入局机器人赛道。 作者丨高景辉 编辑丨马晓宁AI科技评论独家获悉,前毫末智行CEO顾维灏创业,成立公司「紫星勤行」 ,布局酒店服务机器人赛道,其团队成员主要来自于百度和Momenta
阅读全文今年春节,元宝将有一场硬仗要打。作者丨胡敏编辑丨包永刚“每个企业的基因不同、体质不同,腾讯的风格就是稳扎稳打。”腾讯2026年员工大会上,面对外界AI焦虑,腾讯董事会主席兼首席执行官马化腾一开场,就给
阅读全文五个真实物理任务实测,PhysMaster 可推导、写码、数值验证。作者丨郑佳美编辑丨岑峰当大模型的能力从能回答问题走向能完成任务,AI for Science 也正在经历一次更深层的转向。过去行业更
阅读全文“选择悖论”正在AI模型与算力世界里上演。作者丨赵之齐编辑丨包永刚北京一月的初雪落下前,我们在清华见到了翟季冬教授。他手持保温杯,说话很利落,即便一边思考一边叙述,言辞间也几乎没有停顿、没有模糊地带。
阅读全文浙江人形已实现机器人工业场景下的批量应用,资本持续加码中。作者丨刘欣编辑丨高景辉AI科技评论独家获悉,浙江人形机器人创新中心有限公司(简称“浙江人形”)已于近日完成4.5亿元Pre-A轮融资。截至目前
阅读全文最新公布的 19 位当选华人学者中,有 7 位来自清华,「清华系」几乎占据三分之一。作者丨郑佳美编辑丨岑峰AI 科技评论获悉,当地时间 1 月 21 日,美国计算机学会(ACM)揭晓了 2025 年最
阅读全文Manus最大的竞争对手,Genspark的登顶之路。作者丨齐铖湧编辑丨马晓宁提起来Agent,最先被关注的肯定是被 Meta 收购的 Manus,而在硅谷投资圈内,另一家 Agent 公司 Gens
阅读全文