全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了

    作者:机器之心发布日期:2025-03-14 11:44:08

    机器之心报道编辑:Panda、泽南给大模型落地,加入极致的务实主义。DeepSeek 引领的新一轮 AI 技术爆发才刚开始,激烈的应用侧竞争也进入了正在进行时。由于官方服务器经常遭遇繁忙、限流等问题,

    阅读全文
  • 文章封面

    MM-Eureka:极少数据实现多模态推理的R1-Zero时刻

    作者:机器之心发布日期:2025-03-14 11:44:08

    尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。例如,R1-V 仅在简单

    阅读全文
  • 文章封面

    CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

    作者:机器之心发布日期:2025-03-14 11:44:08

    本文的主要作者来自 VAST、北京航空航天大学、清华大学和香港大学。本文的第一作者为北京航空航天大学硕士生黄泽桓,主要研究方向为生成式人工智能和三维视觉。本文的通讯作者为 VAST 首席科学家曹炎培和

    阅读全文
  • 文章封面

    arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读

    作者:机器之心发布日期:2025-03-14 11:44:08

    机器之心报道机器之心编辑部现在是 2025 年,新论文要以博客形式出现。还有人沉浸在阅读论文的苦恼吗?面对 arXiv 上浩如烟海的学术论文,你是否也曾感到无从下手?复杂的术语、冗长的段落、晦涩的图表

    阅读全文
  • 文章封面

    20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!

    作者:机器之心发布日期:2025-03-13 10:44:02

    机器之心发布机器之心编辑部潞晨科技正式推出 Open-Sora 2.0 —— 一款全新开源的 SOTA 视频生成模型,仅 20 万美元(224 张 GPU)成功训练商业级 11B 参数视频生成大模型。

    阅读全文
  • 文章封面

    超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

    作者:机器之心发布日期:2025-03-13 10:44:02

    机器之心报道编辑:杜伟、陈陈大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。通常来说,这些方法在训练模型时可以产生比典型正确解

    阅读全文
  • 文章封面

    YOLOe问世,实时观察一切,统一开放物体检测和分割

    作者:机器之心发布日期:2025-03-13 10:44:02

    机器之心报道机器之心编辑部它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only

    阅读全文
  • 文章封面

    长链推理表象下,大模型精细表征张冠李戴的本质

    作者:机器之心发布日期:2025-03-13 10:44:02

    作者:张拳石、陈鹭近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,De

    阅读全文
  • 文章封面

    阿里妈妈搜索广告2024大模型思考与实践

    作者:机器之心发布日期:2025-03-13 10:44:02

    作者:石士 阿里妈妈技术团队一、概览随着大模型时代的到来,搜推广模型是否具备新的进化空间?能否像深度学习时期那样迸发出旺盛的迭代生命力?带着这样的期待,阿里妈妈搜索广告在过去两年的持续探索中,逐步厘清

    阅读全文
  • 文章封面

    20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭

    作者:机器之心发布日期:2025-03-12 14:15:41

    机器之心发布机器之心编辑部DeepSeek 的风甚至吹到了美妆区。近日,一小红书博主跟足 DeepSeek 指示上妆,意外打造出「石矶娘娘」妆效,引发全网围观。一场看似无厘头的跨界实验,实则揭示了美妆

    阅读全文
  • 文章封面

    字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露

    作者:机器之心发布日期:2025-03-12 14:15:41

    机器之心发布机器之心编辑部就在今天,字节豆包大模型团队在 arxiv 上发布了一篇技术报告,完整公开了文生图模型技术细节,涵盖数据处理、预训练、RLHF 在内的后训练等全流程模型构建方法,也详细披露了

    阅读全文
  • 文章封面

    将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理

    作者:机器之心发布日期:2025-03-12 14:15:41

    机器之心报道编辑:杜伟、蛋酱继上月末连发两篇论文(扩散模型不一定需要噪声条件和分形生成模型)之后,大神何恺明又出新作了!这次的主题是「用于物理推理的去噪哈密顿网络」。物理推理包含推断、预测和解释动态系

    阅读全文
  • 文章封面

    GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

    作者:机器之心发布日期:2025-03-12 14:15:41

    如何让万亿级基础大模型能够高效、低成本地服务于大规模工业级应用,并且让能够随着模型规模的提升(Scaling)而得到持续的性能增长?这一直是众多企业困扰良久的难题。在线广告推荐系统是互联网平台的核心服

    阅读全文
  • 文章封面

    从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里

    作者:机器之心发布日期:2025-03-11 11:51:57

    机器之心报道机器之心编辑部前段时间,幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。论文地址:https://arxiv.org/pdf/2502.11089从论文的署名信

    阅读全文
  • 文章封面

    使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

    作者:机器之心发布日期:2025-03-11 11:51:57

    选自hrishbh.com作者:Hrishbh Dalal编译:Panda、蛋酱没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?近日,技术博主 Hrishbh Dalal 的实践表明

    阅读全文
  • 文章封面

    12万级标配激光雷达:零跑把高阶智驾做到了极致

    作者:机器之心发布日期:2025-03-11 11:51:57

    机器之心报道编辑:泽南12.98 万元标配激光雷达 + 端到端智驾,通义千问 + DeepSeek 双模型智能座舱。进入 2025 年,「智能化」成为了各家车企的主要竞争方向,不论是高阶智能驾驶还是

    阅读全文
  • 文章封面

    ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

    作者:机器之心发布日期:2025-03-11 11:51:57

    兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的 3D 生成模型、3D 重建与编辑。尽管 3D 内容生成技术取得了显著

    阅读全文
  • 文章封面

    “专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心发布机器之心编辑部在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。北大博士瑞晨曾经不得已搁置的想法,也

    阅读全文
  • 文章封面

    Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心报道机器之心编辑部最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久,大家纷纷在线求购邀请码,都想亲自上手一

    阅读全文
  • 文章封面

    全新CoD颠覆推理范式,准确率接近但token消耗成倍降低

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心报道编辑:凯文、杜伟随着推理模型 Deepseek R1 的爆火,Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域,开创性地提出 Chain of Draft(CoD)技术框架,重

    阅读全文
  • 文章封面

    机器人泛化能力大幅提升:HAMSTER层次化方法和VLA尺度轨迹预测,显著提升开放世界任务成功率

    作者:机器之心发布日期:2025-03-10 18:08:25

    近年来,人工智能在视觉和自然语言处理方面取得了惊人的泛化能力,但在机器人操作领域,端到端方法往往需要大量昂贵的本域数据,且难以在不同硬件平台与开放场景下推广。为此,HAMSTER(Hierarchic

    阅读全文
  • 文章封面

    上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

    作者:机器之心发布日期:2025-03-09 12:08:30

    一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗

    阅读全文
  • 文章封面

    Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道编辑:佳琪、蛋酱半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择

    阅读全文
  • 文章封面

    GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道机器之心编辑部一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等

    阅读全文
  • 文章封面

    长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

    作者:机器之心发布日期:2025-03-09 12:08:30

    随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑

    阅读全文
  • 文章封面

    7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

    作者:机器之心发布日期:2025-03-08 12:18:44

    研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研

    阅读全文
  • 文章封面

    目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道编辑:杨文、泽南从来没见过人类做出这样的决策……太优美了。又有谷歌大模型核心成员出来创业了。3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Re

    阅读全文
  • 文章封面

    微软甩开OpenAI自研大模型,还计划用DeepSeek

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道机器之心编辑部思维链引发的战争。众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。但随着近期 AI 技术的突破、双方的分歧

    阅读全文
  • 文章封面

    ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

    作者:机器之心发布日期:2025-03-08 12:18:44

    该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool

    阅读全文
  • 文章封面

    攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」

    作者:机器之心发布日期:2025-03-08 12:18:44

    本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人

    阅读全文
上一页下一页