全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    具身操作大模型InternVLA·A1上线,助力实现高动态场景下的多机器人协作 | 具身智能开源周 Day4

    作者:机智流发布日期:2025-09-18 21:20:15

    本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1

    阅读全文
  • 文章封面

    日报:通义DeepResearch开源,重塑AI科研流程|面壁智能发布SOTA语音生成基座模型

    作者:机智流发布日期:2025-09-18 21:20:15

    作者:yanbo新闻资讯面壁智能发布VoxCPM:语音生成媲美真人,声音复刻逼真面壁智能携手清华大学深圳国际研究生院推出 0.5B 参数语音生成基座模型 VoxCPM。该模型在 自然度、音色相似度和韵

    阅读全文
  • 文章封面

    从“全量记忆”到“智能裁剪”:LangChain 新记忆模式实战指南

    作者:机智流发布日期:2025-09-17 22:34:07

    作者:李剑锋前言在上节课里LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战,我们其实讲到了如何使用 LangChain 里 RunnableWi

    阅读全文
  • 文章封面

    阿里通义今日狂发6篇论文| 霸榜HF今日论文

    作者:机智流发布日期:2025-09-17 22:34:07

    今天打开 Hugging Face Daily Paper 惊呆了,看到了 6 篇阿里通义实验室的论文。论文选自 Hugging Face 每日论文,解读由 Intern-S1 等AI生成。(1) W

    阅读全文
  • 文章封面

    聊聊大模型推理系统之FineServe突破混精大模型服务瓶颈:SLO达标率提升2.2倍的三大创新

    作者:机智流发布日期:2025-09-16 22:29:36

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对你是否想过,当多个不同精度的大语言模型(LLM)共享同一块 GPU 时,内存效率为何总是“打架”?量化模型明明更省显存,但实

    阅读全文
  • 文章封面

    万字长文解答为何LLM同问不同答?OpenAI前CTO团队最新研究让大模型结果可复现

    作者:机智流发布日期:2025-09-15 23:34:37

    本文由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部编译校对原文:Defeating Nondeterminism in LLM Inference — Thinking Mach

    阅读全文
  • 文章封面

    VLA-Adapter:北邮等团队以0.5B参数实现机器人智能新高度,还无需预训练

    作者:机智流发布日期:2025-09-14 21:07:20

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在人工智能与机器人技术迅猛发展的今天,如何让机器人更高效、更智能地理解环境、执行任务,成为了学术界与工业界共同关注的焦点。传

    阅读全文
  • 文章封面

    Parallel-R1 等|HF本周论文TOP20

    作者:机智流发布日期:2025-09-14 21:07:20

    🔥论文选自 Hugging Face 本周论文,解读由 Intern-S1 生成可能有误!(1) Sharing is Caring: Efficient LM Post-Training with

    阅读全文
  • 文章封面

    理解和生成让任务真的能相互受益吗,还是仅仅共存?北大&百度UAE框架,统一视觉理解与生成,实现多模态模型新突破

    作者:机智流发布日期:2025-09-13 23:45:58

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在多模态人工智能领域,一个长期困扰研究者的难题是:理解任务(如图像到文本的转换)和生成任务(如文本到图像的合成)真的能相互促

    阅读全文
  • 文章封面

    聊聊大模型推理系统之Q-Infer技术突破:GPU-CPU协同推理提速3倍背后的三大创新

    作者:机智流发布日期:2025-09-12 22:00:00

    全文约 2000 字,预计阅读时间 7 分钟你是否知道,当前大模型推理系统在面对高并发请求时,常常陷入“低延迟”与“高吞吐”不可兼得的两难境地?一边是聊天机器人需要秒级响应,另一边是批量数据处理追求整

    阅读全文
  • 文章封面

    不蒸馏也超强?揭秘端到端文档OCR模型 POINTS-Reader

    作者:机智流发布日期:2025-09-12 22:00:00

    目前论文已经被 EMNLP 2025 主会录取,同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.c

    阅读全文
  • 文章封面

    Voice Agent 全球开发者比赛,TEN Dev Challenge 2025 等你来战!

    作者:机智流发布日期:2025-09-12 22:00:00

    TEN Dev Challenge 2025 全球开发者大赛现已启动,本次赛事聚焦实时交互与对话式AI领域,面向全球开发者开放参与通道。无论您是独立开发者,还是 3 人以内的小型开发团队,均可通过线上

    阅读全文
  • 文章封面

    LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战

    作者:机智流发布日期:2025-09-11 23:15:00

    作者:李剑锋简介在之前的课程里,我们其实也讲到了一部分 LangChain 相关的记忆内容,包括说:CoversationBufferMemory(保存全部记忆)ConversationBufferW

    阅读全文
  • 文章封面

    日报:通义千问发布Qwen3-ASR-Flash|快手上线AI超级员工Kwali|百度文心X1.1追赶GPT-5

    作者:机智流发布日期:2025-09-11 23:15:00

    全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. 通义千问发布Qwen3-ASR-Flash:语音识别更准,还能听懂歌声通义千问团队正式推出语音识别模型 Qwen3-ASR-Flash。该模型

    阅读全文
  • 文章封面

    IJRR2025|万字长文解读视觉RL在多目标操作中的痛点与ASIMO的突破

    作者:机智流发布日期:2025-09-10 23:30:00

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对;下方简洁版播客由 ListenHub AI 生成想象这样一个场景:在工业流水线上,一台 Franka Panda 机械臂需

    阅读全文
  • 文章封面

    128K上下文+100轮工具调用!港科大联合MiniMax推出WebExplorer-8B,登顶6大信息检索基准

    作者:机智流发布日期:2025-09-09 22:02:41

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部编辑校对近日,香港科技大学(HKUST)与AI公司MiniMax的联合团队,在arXiv上发表了一篇题为“WebExplorer

    阅读全文
  • 文章封面

    周报:A厂完成新轮融资,创AI行业记录|ASML成Mistral AI最大股东|阿里发布万亿级参数大模型

    作者:机智流发布日期:2025-09-09 22:02:41

    新闻资讯Anthropic完成130亿美元融资,估值达1830亿美元创AI行业纪录Anthropic在9月初完成Series F轮融资,公司估值达到1830亿美元,创下AI行业新的估值纪录。Claud

    阅读全文
  • 文章封面

    OpenAI最新研究揭秘大模型为什么会有幻觉!

    作者:机智流发布日期:2025-09-08 23:39:10

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:语言模型的“幻觉”难题在人工智能飞速发展的今天,大语言模型(LLMs)如ChatGPT、DeepSeek等已经成为我们

    阅读全文
  • 文章封面

    解锁你的创造力:如何使用 Nano Banana 生成惊艳的 AI 图像

    作者:机智流发布日期:2025-09-07 23:17:05

    Nano Banana 是谷歌最新、最强大的 AI 图像模型,其官方名称为 Gemini 2.5 Flash Image。Nano Banana 核心亮点:人物一致性:在多次编辑中,保持人物、宠物或物

    阅读全文
  • 文章封面

    AI遇上“胡说八道学”:曼彻斯特大学团队揭示大型语言模型的语义理解瓶颈

    作者:机智流发布日期:2025-09-06 23:41:20

    本文由 Intern-S1、Qwen3 等 AI 生成引言:语言的深层游戏与AI的挑战在社交媒体时代,语言早已不再仅仅是传递信息的工具,它更像是一场充满创意与智慧的游戏。从抖音上的幽默段子到微博上的讽

    阅读全文
  • 文章封面

    腾讯云推出Youtu-Agent:让开源智能体开发像搭积木一样简单,还送300万免费Deepseek令牌!

    作者:机智流发布日期:2025-09-05 22:06:34

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对随着大语言模型技术的爆发,智能体(Agent)已成为AI领域最炙手可热的研究方向。从自动处理邮件的个人助理,到能独立完成数据

    阅读全文
  • 文章封面

    JavaScript进阶之路2:对象、集合、类全解析

    作者:机智流发布日期:2025-09-04 22:04:15

    作者:李剑锋对象定义在 JavaScript 里,对象是键值对的集合,键(属性名)→ 值(任意类型:基本类型、对象、函数都行),最后用{}将其包裹起来即可。其典型用途就是描述实体(如 person)、

    阅读全文
  • 文章封面

    字节Seed团队发布Robix:机器人交互、推理和规划的统一模型,如何让机器人更懂人类?

    作者:机智流发布日期:2025-09-04 22:04:15

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:机器人智能的新篇章在人工智能飞速发展的今天,机器人不再仅仅是执行简单指令的工具,而是逐渐成为能够与人类自然交互、理解复

    阅读全文
  • 文章封面

    HF今日「智能体」方向论文:SimpleTIR、VERLTOOL、UI-TARS-2与Agentic RL综述

    作者:机智流发布日期:2025-09-03 23:34:18

    本文由 Intern-S1、Qwen3 等 AI 生成SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrat

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 MegaScale-Infer:让MoE大模型推理提速1.9倍的三大技术突破

    作者:机智流发布日期:2025-09-02 22:10:47

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对论文链接:https://arxiv.org/html/2504.02263v1你是否想过,一个千亿参数的MoE(Mixtu

    阅读全文
  • 文章封面

    美团开源的LongCat有这么多技术细节!附实测案例

    作者:机智流发布日期:2025-09-02 22:10:47

    大家好,我是刘聪NLP。8月31号,美团开源一个大模型,LongCat,560B的MoE模型,是一个非推理模型。看完他们的技术报告,感觉真在infra和模型结构研究上做了很多,里面真有不少细节!PS:

    阅读全文
  • 文章封面

    MCP-Bench:从金融到科研,UC Berkeley团队揭秘大模型应对多工具协作、长链推理和跨领域协调需求的真实能力

    作者:机智流发布日期:2025-09-01 22:50:56

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对全文约 3600 字,预计阅读时间 10 分钟近年来,大语言模型(LLM)在自然语言处理领域掀起了技术革命。从简单的对话生成

    阅读全文
  • 文章封面

    盘点8月开源大模型!看看哪些你还不知道?

    作者:机智流发布日期:2025-09-01 22:50:56

    大家好,我是刘聪NLP。7月的最后一天,给大家盘点了7月国内的开源大模型!咱们8月也不例外,最后一天看看国内都开源了哪些大模型,看看哪些你知道,哪些你不知道,是时候在明天上班前查缺补漏了,别领导一问,

    阅读全文
  • 文章封面

    无需微调即可实现99.9%的AIME 2025准确率!Meta AI和UCSD如何用“自信度”革新LLM高效推理?

    作者:机智流发布日期:2025-08-31 23:51:03

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对近年来,大语言模型(LLMs)在推理任务中的表现令人叹为观止,特别是在数学竞赛和复杂逻辑推理等高难度场景中。然而,传统的推理

    阅读全文
  • 文章封面

    美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

    作者:机智流发布日期:2025-08-31 23:51:03

    本文转载自「AI 寒武纪」 美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能

    阅读全文
上一页下一页