开源仅一周,鹅厂文生图大模型强势登顶,击败谷歌Nano-Banana
机器之心报道编辑:杜伟、陈陈一夜之间,文生图领域的「王座」被国产大模型拿下!主角是腾讯混元团队发布并开源仅一周的原生多模态生图模型 —— 混元图像 3.0(HunyuanImage 3.0)。在国际权
阅读全文机器之心报道编辑:杜伟、陈陈一夜之间,文生图领域的「王座」被国产大模型拿下!主角是腾讯混元团队发布并开源仅一周的原生多模态生图模型 —— 混元图像 3.0(HunyuanImage 3.0)。在国际权
阅读全文机器之心报道编辑:冷猫早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛
阅读全文“知人者智,自知者明。”——《道德经》古人早已洞见:真正的人类智慧,不仅仅在于公式推演、掌握技艺,更是能理解他人、洞察人心。今天的大语言模型已能在代码、数学与工具使用上出色地完成任务,然而距离成为真正
阅读全文机器之心报道机器之心编辑部Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任务。其中「计算机使用智能体」(
阅读全文机器之心报道机器之心编辑部「人工智能是新的电力。」——吴恩达吴恩达 (Andrew Ng) 执教的斯坦福 CS230 深度学习旗舰课程已更新至 2025 秋季版,首讲视频现已公开!课程采用翻转课堂模式
阅读全文本文作者团队来自 Insta360 影石研究院及其合作高校。目前,Insta360 正在面向世界模型、多模态大模型、生成式模型等前沿方向招聘实习生与全职算法工程师,欢迎有志于前沿 AI 研究与落地的同
阅读全文机器之心报道编辑:+0Meta 内部混战又有新剧情了,这次主角是 FAIR 实验室。据 The Information 报道,两位知情人士透露,Meta 最近对 FAIR 实验室施加了一项新政策:所有
阅读全文机器之心报道机器之心编辑部推理训练促使大语言模型(LLM)生成长思维链(long CoT),这在某些方面有助于它们探索解决策略并进行自我检查。虽然这种方式提高了准确性,但也增加了上下文长度、token
阅读全文本文第一作者王升,陈鹏安与周靖淇均来自香港大学。通讯作者为香港大学计算机科学系吴川教授与孔令鹏教授。其他作者还包括来自香港大学的李沁桐、董经纬、高佳慧,以及香港中文大学的薛博阳、江继越。想象一下,你接
阅读全文机器之心报道机器之心编辑部对于大模型开发者 / 研究者来说,今天是重要的一天。因为刚刚,OpenAI 前 CTO Mira Murati 创办的 Thinking Machines 推出了首款产品 —
阅读全文小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。
阅读全文机器之心报道机器之心编辑部没想到吧,在别家节前卷大模型时,OpenAI 悄悄发布了 Sora2。而且,这次是直接产品化,推出了 App,甚至还有配套的视频推送算法,声称可以防成瘾。这是要做自己的 Ti
阅读全文机器之心报道编辑:+0在 AI 圈里,聚光灯总是追逐着那些履历光鲜的明星人物。但一个伟大的团队,不仅有台前的明星,更有无数在幕后贡献关键力量的英雄。之前我们介绍了 OpenAI 的两位波兰工程师,最近
阅读全文近年来,以强化学习为核心的训练方法显著提升了大语言模型(Large Language Models, LLMs)的推理能力与对齐性能,尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。尽管
阅读全文机器之心报道机器之心编辑部新一代大模型的发布,都赶在了国庆假期前。昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM
阅读全文机器之心发布机器之心编辑部2025年9月17日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”)。
阅读全文面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spati
阅读全文机器之心报道机器之心编辑部SALMONN 家族在首个通用音频理解模型(ICLR 2024)和首个全要素音视频理解模型 video-SALMONN(ICML 2024)基础上再次迎来重磅扩容,霸榜各大音
阅读全文机器之心发布机器之心编辑部为具身智能行业提供了一个可复用、可扩展的通用基座,同时开源训练数据集。今天,北京智源人工智能研究院(BAAI)正式开源 RoboBrain-X0,一个能够在零样本泛化、轻量微
阅读全文近年来,3D 原生生成模型在游戏、影视和设计领域的资产创建中展现出强大潜力。然而,大多数现有方法仍主要依赖图像作为条件输入,缺乏细粒度、多模态的控制能力,限制了其在实际生产流程中的应用。为解决这一瓶颈
阅读全文机器之心报道编辑:Panda、泽南AI 行业很多人相信,我们正在或已经进入所谓的「AI 下半场」。在这一轮 AI 的浪潮中,硬件的竞争早已不再是单纯的算力比拼,而是一场围绕软件、开发者与生态的「护城河
阅读全文机器之心报道编辑:冷猫思考自身行为的后果,并在必要时进行修正 —— 这是人类智慧的核心特征之一。一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines La
阅读全文机器之心发布机器之心编辑部「统一认知、智能执行、决策中枢、记忆进化、智能体工厂、AI治理」六大维度,让企业彻底跳出「用AI」的工具思维,成为「AI原生组织」。走进任何一家大中型企业,「系统横跳」已成为
阅读全文由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。论
阅读全文机器之心原创编辑:吴昕全 AI 生成高质量剧情长片已经在技术上成为可能。去年九月,中国香港动画公司 ManyMany Creations Limited 的几位年轻主创立下了一个几乎「逆天」的目标——
阅读全文机器之心报道编辑:泽南、杨文AI 的颠覆近在眼前,奥特曼不是乱说的。时至今日,我们已见过太多大模型的评估方法。比如涵盖了数十个学科的考试式问题的学术基准 MMLU,还有 SWE-Bench (软件工程
阅读全文张昊然,上海交通大学人工智能学院的博士一年级学生,主要研究兴趣为大模型推理和可信人工智能。去年 12 月,OpenAI 提出的 Deliberative Alignment 引发了广泛关注。面对用户安
阅读全文机器之心报道作者:Youli谁最懂场景,谁赢得未来。9 月 25 日,北京,深秋的气息逐渐浓烈,即便太阳高悬,空气中还是流露出些许凉意,而在中关村国际创新中心,一墙之隔的里面,却是喧哗而热闹。人形机器
阅读全文近期,快手 Kwaipilot 团队推出了 KAT 系列两款突破性 Agentic Coding 大模型:开源 32B 参数模型 KAT-Dev-32B 与闭源旗舰模型 KAT-Coder。这两款模
阅读全文近日,北京大学王选计算机研究所周嘉欢助理教授与彭宇新教授合作在人工智能重要国际期刊 IEEE TPAMI 发布一项最新的研究成果:DKP++(Distribution-aware Knowledge
阅读全文