13年后,AlexNet源代码终于公开:带注释的原版
机器之心报道编辑:张倩、泽南从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷
阅读全文机器之心报道编辑:张倩、泽南从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。想知道 AlexNet 2012 年的原始代码长什么样吗?现在,机会来了!刚刚,谷
阅读全文机器之心发布机器之心编辑部近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能
阅读全文机器之心报道编辑:2049、PandaRoblox,这个备受青少年喜爱的在线游戏平台,正通过引入 AI 技术,进一步革新游戏的创作体验。据了解,曾获选「儿童票选奖最受欢迎游戏」的 Roblox 允许用
阅读全文通讯作者包括腾讯 AI Lab研究员宋林峰与涂兆鹏,以及厦门大学苏劲松教授。论文第一作者为厦门大学博士生王安特。本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜
阅读全文机器之心报道编辑:Panda、蛋酱波士顿动力Atlas不语,只是一味双手撑地翻跟斗。昨天,宇树机器人发布了一段视频,宣布首次让人形机器人实现了侧空翻,吸睛无数。而就在这段视频发出后不到 12 小时,波
阅读全文机器之心报道编辑:Panda如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整
阅读全文机器之心报道机器之心编辑部当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含
阅读全文机构:华为诺亚决策推理实验室作者:李银川、郝建业等人近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。由于生成模型能够处理复杂的数据分布,并具备强大的建模能力
阅读全文机器之心报道机器之心编辑部Token is the new frontier.「因为 AI 技术爆发,GTC 大会的规模每年都在扩大,以前人们说 GTC 是 AI 的伍德斯托克音乐节,今年我们搬进了体
阅读全文选自simonwillison.net作者:Simon Willison机器之心编辑部近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领
阅读全文本文的作者均来自新加坡国立大学 LinS Lab。本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。本文的通讯作者为新加
阅读全文LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。通讯作者为香港科技大学助理教授 Har
阅读全文机器之心报道编辑:杜伟、泽南DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领
阅读全文机器之心报道编辑:张倩多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。小模型正在变得越来越好,而且越来越便宜。刚刚,法国 AI 创企
阅读全文机器之心报道编辑:陈陈今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解答
阅读全文本文作者来自香港科技大学、香港科技大学(广州)、香港城市大学以及UIUC等机构。其中,港科大在读博士生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者;林熙博士目前担任港城大博士后
阅读全文机器之心报道编辑:张倩、佳琳灵活到像 CG,官方却说是一倍速实拍,国产机器人又整活了。自打国产人形机器人在春晚扭秧歌出圈后,它们在「斗舞」这个赛道是越走越远了。图中的机器人来自众擎,名叫 PM01。它
阅读全文机器之心编译编辑:江龙最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。2025 年 1 月,OpenAI 发布了名为 DeepResearch 的 o3 模型变种,专门用于网页和文档
阅读全文机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列
阅读全文王鑫涛,复旦大学博士生,师从肖仰华、汪卫教授,致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术,在AI角色扮演领域发表多篇ACL/EMNLP论文,以及该领域首篇研究综述,
阅读全文机器之心原创编辑:陈陈、杨文AI 竞争进入白热化阶段。这次,轮到百度给自家大模型上强度。刚刚,百度一口气官宣了两款大模型,分别是文心大模型 X1 和文心大模型 4.5。那么,这两款大模型有啥区别呢?这
阅读全文机器之心报道编辑:杜伟、大盘鸡Cursor 也学会「怠工」了?它不仅对用户的运行要求说「No」,还给出了合理的理由。近日,一位国外 X 用户「JanSwist」在使用 Cursor 编码时,有了这一发
阅读全文最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务,同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模型
阅读全文本文由慕尼黑工业大学与北京大学联合团队撰写。第一作者刘强为慕尼黑工业大学博士生。第二作者楚梦渝为北京大学助理教授,专注于物理增强的深度学习算法,以提升数值模拟的灵活性及模型的准确性和泛化性。通讯作者
阅读全文机器之心原创作者:吴昕一觉醒来,AI 应用变天了。很多人每天还在搜索框里用手动挡的方式找信息,随着阿里 AI 旗舰应用夸克发布 「AI 超级框」,超级 Agent 时代呼啸而来,至少 2 亿人顷刻之间
阅读全文机器之心报道编辑:杜伟、王佳琳去年初,OpenAI 的视频生成模型 Sora 带火了扩散模型。如今,扩散模型被广泛用于生成图像和视频,并在生成文本或生物序列等离散数据方面变得越来越有效。从技术上讲,与
阅读全文AoT 作者团队来自 MetaGPT 开源社区。第一作者为香港科技大学(广州)的滕枫蔚,通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖。团队还包括 DeepWisdom 研究员于兆洋、中国
阅读全文机器之心报道机器之心编辑部语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。在 AI 这条赛道上,语音助手也是大家重点发力的
阅读全文论文第一作者为香港中文大学(深圳)理工学院在读博士生郭永新,指导老师为通讯作者为香港中文大学(深圳)理工学院 / 人工智能学院助理教授唐晓莹,课题组研究方向包括大模型、联邦学习、充电智能优化与博弈等。
阅读全文机器之心原创作者:闻菲、张倩「国产大模型 + 国产引擎 + 国产芯片」的完整技术闭环正在加速形成。随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI 落地的
阅读全文