声音克隆 :CosyVoice3和IndexTTS2哪个比较强?
昨天(已经是前天了)发布了 CosyVoice3 的一键运行包,今天汇总一下评论区的问题。其中问到比较多的几个问题是:硬件配置要求是什么?和 B站 的 IndexTTS2 比怎么样?第一个问题,我是
阅读全文昨天(已经是前天了)发布了 CosyVoice3 的一键运行包,今天汇总一下评论区的问题。其中问到比较多的几个问题是:硬件配置要求是什么?和 B站 的 IndexTTS2 比怎么样?第一个问题,我是
阅读全文Prof.Tom Yeh在发布这份文档时抛出了一个简单直接的挑战:“Can you solve these 20 Agent problems?”这是一份 “Agentic AI Problem Se
阅读全文在AI助手日益融入我们数字生活的今天,你是否想过,未来的AI不仅能与你对话,还能像真人一样操作你的手机或电脑,替你完成从点外卖、订机票到处理文档等一系列任务?前段时间,字节旗下、和中兴合作的豆包AI手
阅读全文一同探索语音驱动的下一代人机交互界面。2025 年 RTE 开发者社区的收官活动,将再次落地硬件之都深圳,一起畅想 2026!聚焦「对话式 AI+硬件」主题, 来自通义百聆 Fun-CosyVoice
阅读全文已经好几个月没用扣子了。今天想起来有个工作流还在上面放着,打开扣子网站发现改名了:扣子编程!我以为扣子准备也要新做一个跟百度秒哒、Google AI Studio一样的Vibe Coding产品,不以
阅读全文我们已经成功地创造了一个非常基本的RPG环境,包括敌人、关卡通关提示和状态栏等。然而,我们忽略了一个非常“RPG”的元素,即道具掉落。道具掉落是一个非常棒的功能,因为它可以带来灵活性和广泛的功能。从恢
阅读全文AI时代,你的产品做出来了,然后呢?从"能跑"到"能用"的最后一公里AI产品开发已经成为一个几乎全民参与的赛道。网上铺天盖地的文章都在教你怎么用AI做个东西出来。但我想问一句:东西做出来之后,你怎么给
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......vivo的S系列又更新了。在小雷印象中,vivo的小屏「神机」S30 Pro mini还没发布多
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......12月19日消息,微信首个AI助手元宝宣布上线新能力,支持一句话在微信内设置提醒。图源:公众号不
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......大家好!不知道你们有没有过这种经历——辛辛苦苦P好一张图,发到群里或朋友圈,结果下一秒就发现:糟
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......卧槽,字节又撒钱了。12月19号,就在平平无奇的冬至前几天,字节跳动一封内部邮件,直接把同行看懵
阅读全文超过100家企业在火山引擎上累计Tokens使用量超过一万亿。作者丨代聪飞编辑丨林觉民12月18日,上海世博中心,火山引擎原动力大会现场人山人海。谭待表示,截至今年12月,豆包大模型日均Tokens使
阅读全文我们正在努力创建一个具备三维感知能力的视频世界模型。作者丨齐铖湧编辑丨马晓宁世界模型的研究尚处于起步阶段,共识尚未形成,有关该领域的研究形成了无数支流,过去一年多,Sora为代表的视频生成模型,成为继
阅读全文OpenAI 的十周岁生日,过得不太体面。在当天发布的 GPT-5.2 交出了一份完美答卷:它横扫许多基准测试的 SOTA,在数学和编程等竞赛场景中的表现堪称亮眼,也被官方描述为 AI「超级大脑」。可
阅读全文很多团队都撞墙的地方,有了新方向👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon最近一年,关于一句话的讨论特别热:「Diffusion 就是比 VAE 更好。」这句话之所以流行,其实不难
阅读全文梦瑶 发自 凹非寺量子位 | 公众号 QbitAI江湖老话常说“船大难掉头”,但握着上亿真实用户的「QQ浏览器」偏偏在AI这趟急流里,转得又稳又狠。就在前不久,这位浏览器圈的头号玩家悄悄按下了转型键,
阅读全文henry 发自 凹非寺量子位 | 公众号 QbitAI想要实现AGI,技术创新和规模扩展得五五开,缺一不可。在最新一期播客中,DeepMind掌门人哈萨比斯清晰地勾勒了他心目中通往AGI的一条现实路
阅读全文3DGenR1团队 投稿 量子位 | 公众号 QbitAI在大语言模型和文生图领域,强化学习(RL)已成为提升模型思维链与生成质量的关键方法。但当我们将目光转向更为复杂的文本到3D生成时,这套方法还会
阅读全文浙江大学ReLER团队 投稿量子位 | 公众号 QbitAI尽管扩散模型在单图像生成上已经日渐成熟,但当任务升级为高度定制化的多实例图像生成(Multi-Instance Image Generati
阅读全文编辑|Panda、泽南大模型的竞争如火如荼,也有一群人正在研究如何降低门槛,让 AI 工具变得亲民。最近,在 AI 基础算力上重磅频出的华为,又亮出了一张王牌:昇腾的底层基础软件,CANN 全面开源开
阅读全文机器之心编辑部混合专家(MoE)模型已成为在不显著增加计算成本的情况下,实现语言模型规模化扩展的事实标准架构。近期 MoE 模型展现出明显的高专家粒度(更小的专家中间层维度)和高稀疏性(在专家总数增加
阅读全文本文的第一作者雍希贤是来中国人民大学的博士生,研究方向聚焦于 Humanoid AI,LLM Coginition & Reasoning。通讯作者为中国人民大学的周骁副教授以及腾讯天衍实验室的吴贤。
阅读全文图片由AI生成▎周受资内部信曝TikTok美国方案,字节跳动保留算法、电商、广告,新合资公司负责安全。文|LCC_Beta版作者|李程程编辑|李玉鹏本文首发于钛媒体APP当地时间12月18日,TikT
阅读全文捅破 5 分钟长续航天花板,SOTA 级权重直接全开源。2025 年,视频生成赛道已经进入了卷细节、卷长时序的深水区。当行业已经能够产出几秒钟极具视觉冲击力的镜头时,实际落地中却总会撞上几堵隐形的墙:
阅读全文研究背景大型语言模型虽能力强大,却常受困于事实幻觉和知识滞后 [1]。检索增强生成技术通过引入外部知识源(如知识图谱 KG)来弥补这些缺陷,已成为提升模型可靠性的关键 [2]。然而,当 RAG 系统需
阅读全文新智元报道 编辑:定慧【新智元导读】谷歌这波像开了「大小号双修」:前脚用Gemini把大模型战场搅翻,后脚甩出两位端侧「师兄弟」:一个走复古硬核架构回归,一个专职教AI「别光会聊,赶紧去干活」。
阅读全文新智元报道 编辑:Aeneas【新智元导读】美国能源部联手OpenAI、谷歌等24巨头,启动国家AI「创世纪计划」!从此,硅谷+白宫联手,核能、量子、材料科学将实现新突破。媒体称:AI曼哈顿计划
阅读全文新智元报道 编辑:元宇【新智元导读】AI不应是巨头游戏,模型也不是越大越聪明。近日,「Transformer八子」中的Ashish Vaswani和Parmar共同推出了一个8B的开源小模型,剑
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文