聊聊大模型推理系统之 Cornserve:当 Qwen Omni 遇上智能拆装,吞吐提升近 4 倍的秘密
图片由AI生成在大模型迈向“全能”的时代,Any-to-Any 多模态模型正迅速崛起——它们不仅能理解文本、图像、视频、音频等多种输入,还能生成文本、图像、语音等任意组合的输出。然而,这类模型的复杂异
阅读全文图片由AI生成在大模型迈向“全能”的时代,Any-to-Any 多模态模型正迅速崛起——它们不仅能理解文本、图像、视频、音频等多种输入,还能生成文本、图像、语音等任意组合的输出。然而,这类模型的复杂异
阅读全文> 本文转载自「沐曦股份MetaX」1前言01版本概述与核心定位近期,沐曦股份发布了MXMACA软件栈(以下简称“MACA”)的3.3.0.X版本,MACA套件是面向沐曦曦云C系列、曦思N系列GPU研
阅读全文当 Agent 开始进入真实业务。👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon过去这一年,大家都在谈大模型。不管是朋友圈还是技术群,话题总离不开「国内外哪家模型又突破了」或者「哪个榜
阅读全文▎时隔三年,以“大模型‘拐点’之年,AI下一个十年看什么”为主题,赵何娟与张宏江再次进行了一场关于AI的深度对话。赵何娟丨钛媒体集团创始人&CEO12月17日,在钛媒体2025 T-EDGE全球对话中
阅读全文还记得前段时间在 AI 圈刷屏的李飞飞「3D 世界生成模型」吗?现在,国产版终于来了。就在上周腾讯官宣姚顺雨加盟的新闻刷屏时,腾讯混元团队低调上线了世界模型 1.5(TencentHY WorldPl
阅读全文还记得之前非常火的雪宝Olaf机器人吗?那个走起路来晃晃悠悠、神态活灵活现的小家伙曾让无数人直呼“次元壁破了”。近期,迪士尼幻想工程(Disney Research Imagineering)终于揭开
阅读全文我们很高兴推出全新图像生成模型Qwen-lmage-Layered,新模型采用自研创新架构,可将图片“拆解”成多个图层。这种分层表示赋予了图像内在的可编辑性:每个图层都可以独立操作,而不会影响其他内容
阅读全文今天想聊一个不那么性感但极其致命的话题——部署。我们团队在做AI产品商业化交付的过程中,模型调得再好、Agent设计得再精妙,最后都要过部署这一关。而这一关,恰恰是我们交学费最多的地方。一个残酷的现实
阅读全文把公司交给 Claude 会怎样?答案是:先破产,再修仙。在 AI Agent 被吹上天的 2025 年,Anthropic 和《华尔街日报》联手整了个真·大活。大家都在畅想以后 AI 能帮我们打工、
阅读全文今天,我们很高兴向大家介绍 MiniMax 视频团队刚刚开源的工作—— VTP(Visual Tokenizer Pre-training);这个工作讨论的是视觉生成模型中的关键组件—— tokeni
阅读全文2025 年还有一周结束,年底,AI 视频圈又卷起来了。今天我在 HuggingFace Daily Paper 上刷到一篇论文,vote 还很高,排到了当天第三名,仔细一看标题,讲的是视觉生成,作者
阅读全文作者|冬梅 在通用大模型赛道尚未走出“长期投入期”的背景下,资本市场已经率先迎来新的叙事节点。12 月 21 日,通用人工智能(AGI)公司 MiniMax(稀宇科技)通过港交所上市聆讯,并首次刊发聆
阅读全文作者 | OpenBMB 团队近日,字节跳动发布的豆包手机助手在业内激起了广泛讨论。这不仅是一款新智能硬件的亮相,更标志着大模型应用范式的一次重要跃迁——从“Chat(对话)”真正迈向“Action(
阅读全文前段时间,Anthropic 正式发布了 Claude Sonnet 4.5,对它的定位是“世界上最好的编码模型”和“构建复杂智能体的最强模型”。凭什么这么说呢,Anthropic 在客户测试中观察到
阅读全文Jay 发自 凹非寺量子位 | 公众号 QbitAI天下苦SaaS已久。服务商为居高不下的推理成本头疼,客户诟病交付质量跟「抽卡」一样反复无常……进入AI时代,SaaS似乎不再是那颗令人趋之若鹜的明珠
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAIMiniMax海螺视频团队不藏了!首次开源就揭晓了一个困扰行业已久的问题的答案——为什么往第一阶段的视觉分词器里砸再多算力,也无法提升第二阶段的生成效
阅读全文TwiG团队 投稿 量子位 | 公众号 QbitAI在文生图(Text-to-Image)和视频生成领域,以FLUX.1、Emu3为代表的扩散模型与自回归模型已经能生成极其逼真的画面。但当你要求模型处
阅读全文机器之心发布在 SIGGRAPH Asia 2025 期间,盛大集团(Shanda Group)旗下,盛大 AI 东京研究院(Shanda AI Research Tokyo)以展台活动、BoF 学术
阅读全文编辑|泽南、+0这就是摩尔线程最新 AI 计算卡 S5000,单卡跑满血 DeepSeek 大模型的成绩。每秒 1024 token 的流畅解码,超过 4000 token 的峰值吞吐,只需要搭载在通
阅读全文长期以来,具身智能系统主要依赖「感知 - 行动」的反应式回路,缺乏对未来的预测能力。而世界模型的引入,让智能体拥有了「想象」未来的能力。具身智能机器人通过世界模型想象抓杯子任务那么关键问题来了:世界模
阅读全文编者按:Gen AI 时代,所有的产品都值得用 AI 重做一遍,操作系统也不例外:液态玻璃正重塑苹果生态的视觉语言,而 Gemini 已渗入 Google Pixel 的每个角落……新一代操作系统正在
阅读全文图片来源:Sequoia CapitalZ Highlights全球仅有0.5%的人会编程,能打造出顶尖产品的人更是凤毛麟角。因此我决定要为那99%的人打造产品,而非只为开发者提升效率。我们要创造一种
阅读全文图片来源:techcrunch知名AI 科学家LeCun周四证实, 他已创办一家新创企业 ——这是科技界人尽皆知的秘密——但他表示不会以首席执行官身份运营这家新公司。他所创办的这家公司名为"高级机器智
阅读全文图片来源:Resolve AI人工智能初创公司Resolve AI 近日完成 A 轮融资,由 Lightspeed Venture Partners 领投。该公司致力于开发自动化站点可靠性工程师工具,
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Anthropic团队提出选择性梯
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!清华与微软团队推出了TRELLIS
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!腾讯混元世界模型 HY-World
阅读全文砂之船集团是国际大型连锁奥莱运营商、中国服务业500强,在全国已布局22家超级奥莱,2024年实现销售额238亿元。集团以“全球奥莱第一品牌”为战略愿景,将AI建设作为重点发展方向。2025年,砂之船
阅读全文