全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房

    作者:机器之心发布日期:2026-01-12 12:58:19

    短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。针对这一问题,快手搜索团队提出了

    阅读全文
  • 文章封面

    不做人形、不跳舞:他家的具身智能凭什么在100+城市卖出400万杯咖啡?

    作者:机器之心发布日期:2026-01-11 11:57:13

    编辑|吴昕新年刚开局,AI 行业就直接拉满强度。在 CES 这个全球科技风向标上,机器人 × AI 成了真正的主角。在拉斯维加斯的霓虹灯下,中国机器人军团走到舞台中央——不靠堆概念,而是带着订单和规模

    阅读全文
  • 文章封面

    挑战GRPO,英伟达提出GDPO,专攻多奖励优化

    作者:机器之心发布日期:2026-01-11 11:57:13

    机器之心编辑部GRPO 是促使 DeepSeek-R1 成功的基础技术之一。最近一两年,GRPO 及其变体因其高效性和简洁性,已成为业内广泛采用的强化学习算法。但随着语言模型能力的不断提升,用户对它们

    阅读全文
  • 文章封面

    联邦学习不再安全?港大TPAMI新作:深挖梯度反转攻击的内幕

    作者:机器之心发布日期:2026-01-11 11:57:13

    本文第一作者郭鹏鑫,香港大学博士生,研究方向是联邦学习、大模型微调等。本文共同第一作者王润熙,香港大学硕士生,研究方法是联邦学习、隐私保护等。本文通讯作者屈靓琼,香港大学助理教授,研究方向包含 AI

    阅读全文
  • 文章封面

    因为AI编程,Tailwind CSS差点死了

    作者:机器之心发布日期:2026-01-10 12:00:00

    编辑|Panda在生成式 AI 狂飙突进的 2026 年,如果你让一个 AI 编程智能体来写网页应用,它很大概率会用到 Tailwind CSS。要知道,其如今的周下载量已经超过了惊人的 2600 万

    阅读全文
  • 文章封面

    打破学科壁垒!400篇参考文献重磅综述,统一调查「人脑×Agent」记忆系统

    作者:机器之心发布日期:2026-01-10 12:00:00

    跨学科突破:神经科学如何让 Agent 拥有「人类式」记忆?你是否想过 Agent 能像人类一样积累经验、不断成长?如今,这一愿景正加速走向现实。但是,现有研究要么只聚焦 AI 技术本身,要么对人脑记

    阅读全文
  • 文章封面

    DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

    作者:机器之心发布日期:2026-01-10 12:00:00

    DeepSeek-OCR 的视觉文本压缩(VTC)技术通过将文本编码为视觉 Token,实现高达 10 倍的压缩率,大幅降低大模型处理长文本的成本。但是,视觉语言模型能否理解压缩后的高密度信息?中科院

    阅读全文
  • 文章封面

    Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

    作者:机器之心发布日期:2026-01-09 12:02:11

    编辑|泽南、Panda如果 AI 工具早一点出现,我们的很多工作会不会提前几年完成?近日,整个科技圈都在感叹 AI 工具带来的效率提升。一些硅谷 AI 大厂工程师现身说法,表示在用了 AI 工具后,项

    阅读全文
  • 文章封面

    谁家更新日志那么长啊?Claude Code版本更新引围观,1096次提交一口气上线

    作者:机器之心发布日期:2026-01-09 12:02:11

    编辑|张倩如果你是 Claude Code 的用户,你可能会注意到,它最近有个重要的版本更新,从节前的 2.0.76 更新到了 2.1.0。而且,这次的日志,你得往下翻好几屏。翻完这个日志,网友不淡定

    阅读全文
  • 文章封面

    大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

    作者:机器之心发布日期:2026-01-09 12:02:11

    近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水

    阅读全文
  • 文章封面

    拓宽百年奥运「赛场边界」,阿里云AI让人人皆可上场

    作者:机器之心发布日期:2026-01-08 17:30:00

    机器之心编辑部先给大家看个视频,你能分辨出哪个是 AI 生成的吗?视频来源:tiktok 博主 @tkp..1001「真人拍摄还是 AI 生成」,如果搁一年前,这个问题还很容易回答,因为细节处总有一眼

    阅读全文
  • 文章封面

    博士申请终极指南:「从准备到抉择」手把手教你拿下理想offer

    作者:机器之心发布日期:2026-01-08 17:30:00

    机器之心编辑部又快到博士申请季。这是一份复杂而又繁琐的工作:无尽的院校调研、纠结的方向选择、厚重的材料准备,以及决定命运的面试……不可能不感到迷茫、焦虑,甚至怀疑,这一切的辛勤付出,究竟能否换来梦想院

    阅读全文
  • 文章封面

    「听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式

    作者:机器之心发布日期:2026-01-08 17:30:00

    针对端到端全模态大模型(OmniLLMs)在跨模态对齐和细粒度理解上的痛点,浙江大学、西湖大学、蚂蚁集团联合提出 OmniAgent。这是一种基于「音频引导」的主动感知 Agent,通过「思考 - 行

    阅读全文
  • 文章封面

    OpenAI前CTO首个创业产品Tinker,这里全量升级开放了,还有羊毛可薅

    作者:机器之心发布日期:2026-01-07 13:13:44

    机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward back

    阅读全文
  • 文章封面

    大模型最难的AI Infra,用Vibe Coding搞定

    作者:机器之心发布日期:2026-01-07 13:13:44

    机器之心发布Andrej Karpathy 大神力荐的 Vibe Coding,正在成为开发者的新宠。这种「只需聊一聊,AI 可以把功能写出来」的体验,极大提升了简单任务的开放效率。然而,当我们目光转

    阅读全文
  • 文章封面

    注意力机制大变革?Bengio团队找到了一种超越Transformer的硬件对齐方案

    作者:机器之心发布日期:2026-01-07 13:13:44

    编辑|PandaTransformer 已经改变了世界,但也并非完美,依然还是有竞争者,比如线性递归(Linear Recurrences)或状态空间模型(SSM)。这些新方法希望能够在保持模型质量的

    阅读全文
  • 文章封面

    刚刚,智元提出SOP,让VLA模型在真实世界实现可扩展的在线进化

    作者:机器之心发布日期:2026-01-06 17:34:56

    编辑|Panda、+0对于电子产品,我们已然习惯了「出厂即巅峰」的设定:开箱的那一刻往往就是性能的顶点,随后的每一天都在折旧。但对于通用机器人来说,这个设定必须被颠覆。试想,如果一个在实验室里完成训练

    阅读全文
  • 文章封面

    独家解读|2025年AI五大趋势与底层数据革命

    作者:机器之心发布日期:2026-01-06 17:34:56

    机器之心发布2025 年,人工智能的发展重心正在发生一次根本性转移:从追求模型的规模,转向构建其理解与解决复杂现实问题的能力。在这一转型中,高质量数据正成为定义 AI 能力的新基石。作为人工智能数据服

    阅读全文
  • 文章封面

    开源1万小时具身智能数据,这家公司是为了什么?

    作者:机器之心发布日期:2026-01-06 17:34:56

    机器之心发布想象一下,你正在训练一个未来的家庭机器人。你希望它能像人一样,轻松地叠好一件衬衫,整理杂乱的桌面,甚至系好一双鞋的鞋带。但最大的瓶颈是什么?不是算法,不是硬件,而是数据 —— 海量的、来自

    阅读全文
  • 文章封面

    别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

    作者:机器之心发布日期:2026-01-06 17:34:56

    2025 年,随着李飞飞等学者将 “空间智能”(Spatial Intelligence)推向聚光灯下,这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新

    阅读全文
  • 文章封面

    刚刚,蝉联Future X全球榜首的MiroMind发布全球最强搜索智能体模型

    作者:机器之心发布日期:2026-01-05 14:06:18

    机器之心发布凭借成功预测 Polymarket 题目,连续登顶 Future X 全球榜首的 MiroMind 团队,于今日(1 月 5 日)正式发布其自研旗舰搜索智能体模型 MiroThinker

    阅读全文
  • 文章封面

    CES 2026超前瞻:空间智能来势汹汹!从实验室奢侈品到消费级刚需,如何重塑 AI 具身时代?

    作者:机器之心发布日期:2026-01-05 14:06:18

    机器之心发布明天,一年一度的 CES 即将在美国拉斯维加斯璀璨开幕。作为全球科技产业最重要的风向标之一,笔者在超前探访之后欣喜发现,在今年机器人「后厨翻炒」与 AI 眼镜「同声传译」的热闹之外,行业终

    阅读全文
  • 文章封面

    AAAI 2026 Oral|InfiGUI-G1模型来了,刷新GUI Grounding SOTA

    作者:机器之心发布日期:2026-01-05 14:06:18

    随着多模态大语言模型(MLLM)的飞速发展,能够像人类一样通过视觉输入操作图形用户界面(GUI)的智能体(Agent)正逐渐成为现实。然而,在通往通用计算机控制的道路上,如何让模型精准地将自然语言指令

    阅读全文
  • 文章封面

    从「被动」到「主动」,为什么给耳机装上「眼睛」后AI范式变了?

    作者:机器之心发布日期:2026-01-04 13:40:10

    编辑|吴昕、Youli先行一步Sam Altman 与 Jony Ive 联手探索的无屏 AI 硬件,正在被逐步揭开。供应链信息显示,这款产品并没有选择屏幕,而更像是一种可穿戴设备:体积接近 iPod

    阅读全文
  • 文章封面

    500万人在线围观,Claude Code创建者的13条独家实战秘籍爆火

    作者:机器之心发布日期:2026-01-04 13:40:10

    机器之心报道2026 新年第三天,Claude Code 创建者、负责人 Boris Cherny 开展「线上教学」,亲自示范他自己使用这个 AI 编程工具的工作流。他表示,自己的配置可能出乎意料地「

    阅读全文
  • 文章封面

    AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法,让端到端自动驾驶更高效

    作者:机器之心发布日期:2026-01-04 13:40:10

    VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自动驾驶设计的,在自动驾驶场景中都具

    阅读全文
  • 文章封面

    4个月烧掉30亿Token,这位「菜鸟」程序员做出50多个产品,360万人围观

    作者:机器之心发布日期:2026-01-03 12:11:05

    机器之心编辑部长久以来,代码世界的大门似乎只对少数掌握秘术的人敞开。我们被告知:你必须先理解内存、掌握语法、忍受枯燥的文档,才配谈论创造。现在,随着大模型的发展,编程不再是一场苦修,而是一场大型即时策

    阅读全文
  • 文章封面

    LeCun在Meta还有论文:JEPA物理规划的「终极指南」

    作者:机器之心发布日期:2026-01-03 12:11:05

    编辑|Panda长期以来,AI 领域一直怀揣着一个宏大的梦想:创造出能够像人类一样直观理解物理世界,并在从未见过的任务和环境中游刃有余的智能体。传统的强化学习方法往往比较笨拙,需要通过无数次的试错和海

    阅读全文
  • 文章封面

    微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

    作者:机器之心发布日期:2026-01-03 12:11:05

    腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型

    阅读全文
  • 文章封面

    「辍学创业」的风再次席卷硅谷,但真正的变量从来不是学位

    作者:机器之心发布日期:2026-01-02 11:09:49

    机器之心编辑部在 80、90 后的成长记忆里,「辍学创业,成为亿万富翁」这类故事流传甚广。理性分析后都知道,这里面有幸存者偏差,也有个体差异 —— 盖茨、扎克伯格都是哈佛级别,随时能回去拿学位;乔布斯

    阅读全文
上一页下一页