Karpathy氛围编码「吃瘪」?Cursor拒绝工作,并劝人类别依赖它
机器之心报道编辑:杜伟、大盘鸡Cursor 也学会「怠工」了?它不仅对用户的运行要求说「No」,还给出了合理的理由。近日,一位国外 X 用户「JanSwist」在使用 Cursor 编码时,有了这一发
阅读全文机器之心报道编辑:杜伟、大盘鸡Cursor 也学会「怠工」了?它不仅对用户的运行要求说「No」,还给出了合理的理由。近日,一位国外 X 用户「JanSwist」在使用 Cursor 编码时,有了这一发
阅读全文最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务,同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模型
阅读全文本文由慕尼黑工业大学与北京大学联合团队撰写。第一作者刘强为慕尼黑工业大学博士生。第二作者楚梦渝为北京大学助理教授,专注于物理增强的深度学习算法,以提升数值模拟的灵活性及模型的准确性和泛化性。通讯作者
阅读全文机器之心原创作者:吴昕一觉醒来,AI 应用变天了。很多人每天还在搜索框里用手动挡的方式找信息,随着阿里 AI 旗舰应用夸克发布 「AI 超级框」,超级 Agent 时代呼啸而来,至少 2 亿人顷刻之间
阅读全文机器之心报道编辑:杜伟、王佳琳去年初,OpenAI 的视频生成模型 Sora 带火了扩散模型。如今,扩散模型被广泛用于生成图像和视频,并在生成文本或生物序列等离散数据方面变得越来越有效。从技术上讲,与
阅读全文AoT 作者团队来自 MetaGPT 开源社区。第一作者为香港科技大学(广州)的滕枫蔚,通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖。团队还包括 DeepWisdom 研究员于兆洋、中国
阅读全文机器之心报道机器之心编辑部语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。在 AI 这条赛道上,语音助手也是大家重点发力的
阅读全文论文第一作者为香港中文大学(深圳)理工学院在读博士生郭永新,指导老师为通讯作者为香港中文大学(深圳)理工学院 / 人工智能学院助理教授唐晓莹,课题组研究方向包括大模型、联邦学习、充电智能优化与博弈等。
阅读全文机器之心原创作者:闻菲、张倩「国产大模型 + 国产引擎 + 国产芯片」的完整技术闭环正在加速形成。随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI 落地的
阅读全文机器之心报道编辑:Panda、泽南给大模型落地,加入极致的务实主义。DeepSeek 引领的新一轮 AI 技术爆发才刚开始,激烈的应用侧竞争也进入了正在进行时。由于官方服务器经常遭遇繁忙、限流等问题,
阅读全文尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。例如,R1-V 仅在简单
阅读全文本文的主要作者来自 VAST、北京航空航天大学、清华大学和香港大学。本文的第一作者为北京航空航天大学硕士生黄泽桓,主要研究方向为生成式人工智能和三维视觉。本文的通讯作者为 VAST 首席科学家曹炎培和
阅读全文机器之心报道机器之心编辑部现在是 2025 年,新论文要以博客形式出现。还有人沉浸在阅读论文的苦恼吗?面对 arXiv 上浩如烟海的学术论文,你是否也曾感到无从下手?复杂的术语、冗长的段落、晦涩的图表
阅读全文机器之心发布机器之心编辑部潞晨科技正式推出 Open-Sora 2.0 —— 一款全新开源的 SOTA 视频生成模型,仅 20 万美元(224 张 GPU)成功训练商业级 11B 参数视频生成大模型。
阅读全文机器之心报道编辑:杜伟、陈陈大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。通常来说,这些方法在训练模型时可以产生比典型正确解
阅读全文机器之心报道机器之心编辑部它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only
阅读全文作者:张拳石、陈鹭近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,De
阅读全文作者:石士 阿里妈妈技术团队一、概览随着大模型时代的到来,搜推广模型是否具备新的进化空间?能否像深度学习时期那样迸发出旺盛的迭代生命力?带着这样的期待,阿里妈妈搜索广告在过去两年的持续探索中,逐步厘清
阅读全文机器之心发布机器之心编辑部DeepSeek 的风甚至吹到了美妆区。近日,一小红书博主跟足 DeepSeek 指示上妆,意外打造出「石矶娘娘」妆效,引发全网围观。一场看似无厘头的跨界实验,实则揭示了美妆
阅读全文机器之心发布机器之心编辑部就在今天,字节豆包大模型团队在 arxiv 上发布了一篇技术报告,完整公开了文生图模型技术细节,涵盖数据处理、预训练、RLHF 在内的后训练等全流程模型构建方法,也详细披露了
阅读全文机器之心报道编辑:杜伟、蛋酱继上月末连发两篇论文(扩散模型不一定需要噪声条件和分形生成模型)之后,大神何恺明又出新作了!这次的主题是「用于物理推理的去噪哈密顿网络」。物理推理包含推断、预测和解释动态系
阅读全文如何让万亿级基础大模型能够高效、低成本地服务于大规模工业级应用,并且让能够随着模型规模的提升(Scaling)而得到持续的性能增长?这一直是众多企业困扰良久的难题。在线广告推荐系统是互联网平台的核心服
阅读全文机器之心报道机器之心编辑部前段时间,幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。论文地址:https://arxiv.org/pdf/2502.11089从论文的署名信
阅读全文选自hrishbh.com作者:Hrishbh Dalal编译:Panda、蛋酱没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?近日,技术博主 Hrishbh Dalal 的实践表明
阅读全文机器之心报道编辑:泽南12.98 万元标配激光雷达 + 端到端智驾,通义千问 + DeepSeek 双模型智能座舱。进入 2025 年,「智能化」成为了各家车企的主要竞争方向,不论是高阶智能驾驶还是
阅读全文兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的 3D 生成模型、3D 重建与编辑。尽管 3D 内容生成技术取得了显著
阅读全文机器之心发布机器之心编辑部在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。北大博士瑞晨曾经不得已搁置的想法,也
阅读全文机器之心报道机器之心编辑部最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久,大家纷纷在线求购邀请码,都想亲自上手一
阅读全文机器之心报道编辑:凯文、杜伟随着推理模型 Deepseek R1 的爆火,Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域,开创性地提出 Chain of Draft(CoD)技术框架,重
阅读全文近年来,人工智能在视觉和自然语言处理方面取得了惊人的泛化能力,但在机器人操作领域,端到端方法往往需要大量昂贵的本域数据,且难以在不同硬件平台与开放场景下推广。为此,HAMSTER(Hierarchic
阅读全文