具身操作大模型InternVLA·A1上线,助力实现高动态场景下的多机器人协作 | 具身智能开源周 Day4
本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1
阅读全文本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1
阅读全文作者:yanbo新闻资讯面壁智能发布VoxCPM:语音生成媲美真人,声音复刻逼真面壁智能携手清华大学深圳国际研究生院推出 0.5B 参数语音生成基座模型 VoxCPM。该模型在 自然度、音色相似度和韵
阅读全文作者:李剑锋前言在上节课里LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战,我们其实讲到了如何使用 LangChain 里 RunnableWi
阅读全文今天打开 Hugging Face Daily Paper 惊呆了,看到了 6 篇阿里通义实验室的论文。论文选自 Hugging Face 每日论文,解读由 Intern-S1 等AI生成。(1) W
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对你是否想过,当多个不同精度的大语言模型(LLM)共享同一块 GPU 时,内存效率为何总是“打架”?量化模型明明更省显存,但实
阅读全文本文由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部编译校对原文:Defeating Nondeterminism in LLM Inference — Thinking Mach
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在人工智能与机器人技术迅猛发展的今天,如何让机器人更高效、更智能地理解环境、执行任务,成为了学术界与工业界共同关注的焦点。传
阅读全文🔥论文选自 Hugging Face 本周论文,解读由 Intern-S1 生成可能有误!(1) Sharing is Caring: Efficient LM Post-Training with
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在多模态人工智能领域,一个长期困扰研究者的难题是:理解任务(如图像到文本的转换)和生成任务(如文本到图像的合成)真的能相互促
阅读全文全文约 2000 字,预计阅读时间 7 分钟你是否知道,当前大模型推理系统在面对高并发请求时,常常陷入“低延迟”与“高吞吐”不可兼得的两难境地?一边是聊天机器人需要秒级响应,另一边是批量数据处理追求整
阅读全文目前论文已经被 EMNLP 2025 主会录取,同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.c
阅读全文TEN Dev Challenge 2025 全球开发者大赛现已启动,本次赛事聚焦实时交互与对话式AI领域,面向全球开发者开放参与通道。无论您是独立开发者,还是 3 人以内的小型开发团队,均可通过线上
阅读全文作者:李剑锋简介在之前的课程里,我们其实也讲到了一部分 LangChain 相关的记忆内容,包括说:CoversationBufferMemory(保存全部记忆)ConversationBufferW
阅读全文全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. 通义千问发布Qwen3-ASR-Flash:语音识别更准,还能听懂歌声通义千问团队正式推出语音识别模型 Qwen3-ASR-Flash。该模型
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对;下方简洁版播客由 ListenHub AI 生成想象这样一个场景:在工业流水线上,一台 Franka Panda 机械臂需
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部编辑校对近日,香港科技大学(HKUST)与AI公司MiniMax的联合团队,在arXiv上发表了一篇题为“WebExplorer
阅读全文新闻资讯Anthropic完成130亿美元融资,估值达1830亿美元创AI行业纪录Anthropic在9月初完成Series F轮融资,公司估值达到1830亿美元,创下AI行业新的估值纪录。Claud
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:语言模型的“幻觉”难题在人工智能飞速发展的今天,大语言模型(LLMs)如ChatGPT、DeepSeek等已经成为我们
阅读全文Nano Banana 是谷歌最新、最强大的 AI 图像模型,其官方名称为 Gemini 2.5 Flash Image。Nano Banana 核心亮点:人物一致性:在多次编辑中,保持人物、宠物或物
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成引言:语言的深层游戏与AI的挑战在社交媒体时代,语言早已不再仅仅是传递信息的工具,它更像是一场充满创意与智慧的游戏。从抖音上的幽默段子到微博上的讽
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对随着大语言模型技术的爆发,智能体(Agent)已成为AI领域最炙手可热的研究方向。从自动处理邮件的个人助理,到能独立完成数据
阅读全文作者:李剑锋对象定义在 JavaScript 里,对象是键值对的集合,键(属性名)→ 值(任意类型:基本类型、对象、函数都行),最后用{}将其包裹起来即可。其典型用途就是描述实体(如 person)、
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:机器人智能的新篇章在人工智能飞速发展的今天,机器人不再仅仅是执行简单指令的工具,而是逐渐成为能够与人类自然交互、理解复
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrat
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对论文链接:https://arxiv.org/html/2504.02263v1你是否想过,一个千亿参数的MoE(Mixtu
阅读全文大家好,我是刘聪NLP。8月31号,美团开源一个大模型,LongCat,560B的MoE模型,是一个非推理模型。看完他们的技术报告,感觉真在infra和模型结构研究上做了很多,里面真有不少细节!PS:
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对全文约 3600 字,预计阅读时间 10 分钟近年来,大语言模型(LLM)在自然语言处理领域掀起了技术革命。从简单的对话生成
阅读全文大家好,我是刘聪NLP。7月的最后一天,给大家盘点了7月国内的开源大模型!咱们8月也不例外,最后一天看看国内都开源了哪些大模型,看看哪些你知道,哪些你不知道,是时候在明天上班前查缺补漏了,别领导一问,
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对近年来,大语言模型(LLMs)在推理任务中的表现令人叹为观止,特别是在数学竞赛和复杂逻辑推理等高难度场景中。然而,传统的推理
阅读全文本文转载自「AI 寒武纪」 美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能
阅读全文