全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    真情实感体验了阿里「千问APP」后,为什么说它是「中国的ChatGPT」?

    作者:机器之心发布日期:2025-11-17 12:20:00

    机器之心报道编辑:Youli、杨文近日,外媒一篇关于阿里 AI 全面入局 C 端之战,秘密启动「千问」项目的报道,在坊间引起各种猜测,甚至连相关的「阿里食堂烧鸭饭」都上了好几次热搜。没办法,大家太好奇

    阅读全文
  • 文章封面

    ChatGPT:再见「破折号」

    作者:机器之心发布日期:2025-11-17 12:20:00

    机器之心报道机器之心编辑部经常使用 AI 的人,大概都注意到模型一个共同特点,那就是它们非常喜欢用破折号。无论是解释概念、列举观点,还是自然过渡语气,动不动就来一个「——」。久而久之,它甚至成了检测

    阅读全文
  • 文章封面

    解决特斯拉「监督稀疏」难题,DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

    作者:机器之心发布日期:2025-11-17 12:20:00

    在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 ——“监督稀疏”。这一问题直指当前 VLA 模

    阅读全文
  • 文章封面

    VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源

    作者:机器之心发布日期:2025-11-17 12:20:00

    长期以来,多模态代码生成(Multimodal Code Generation)的训练严重依赖于特定任务的监督微调(SFT)。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功 ,

    阅读全文
  • 文章封面

    靠创始人亲自假扮AI起家,如今估值10亿美元!印度CEO公开反内卷:从不在10点前起床,也不开例会

    作者:AI前线发布日期:2025-11-17 12:17:00

    作者|冬梅 在人工智能浪潮席卷全球的当下,每一个新晋独角兽似乎都在讲述着同一个神话:技术革命、算法突破、规模化增长、市场验证。然而,很少有企业愿意坦白,在真正意义上的自动化到来之前,支撑业务运转的往往

    阅读全文
  • 文章封面

    将导游装在口袋里:AI 对景区游览新赋能

    作者:AI前线发布日期:2025-11-17 12:17:00

    作者 | 同程旅行研发中心-AI及创新产品团队清晨的阳光透过古老的窗棂,洒在海昏侯国遗址博物馆的展柜上,金色的饼形器在光影交错中泛着神秘的光芒。一位年轻的母亲带着孩子驻足于此,孩子抬起头,眼睛里盛满星

    阅读全文
  • 文章封面

    始末|通义、千问、Qwen、Qwen Chat 的来龙去脉

    作者:赛博禅心发布日期:2025-11-17 12:13:48

    今天,通义改名千问于是很多人懵了通义、千问、通义千问、通义 app、Qwen Chat 到底是啥关系这背后是两个团队的故事2023 年:通义千问诞生2023 年 4 月 7 日,阿里云发布通义千问大

    阅读全文
  • 文章封面

    Agent,源神启动~ 字节整了个原神Agent,Google也发了个游戏Agent SIMA 2。 好像很牛,所以仔细瞧了瞧,到底是如何做到让Agent自己玩游戏的呢? 核心设计好像就再3点上: 第一,一个定时捕捉的视频帧,720P,每200ms捕捉一次。字节的Lumine是基于Qwen2-VL-7B-Base进一步训练的。 第二点,混合推理。就是可以选择是不是要思考,简单场景,直接输出动作就好了,比如移动, 重复的操作。复杂场景,先进行思考,比如出现了新的目标。 第三,就是让模型所有的输出都是,鼠标键盘的序列,直接可执行验证。 训练分三个阶段:基础动作→指令跟随→决策推理。 从Lumine-Base到Lumine-Thinking,能力是阶梯式上升的。 Base版本能拾取、开宝箱、爬墙,但没有目标导向。 Instruct版本可以完成指令,短任务(10秒至数分钟任务)成功率80%+。在璃月这种没训练过的场景也能自主导航。 Thinking版本,使用了使用15小时的人工标注推理数据。让模型学会自主规划、反思与修正的能力,测试下来,以蒙德主线为测试场景,第一章56分钟搞定,GPT-5要112分钟。 第二、三章4.7小时,完成率98.2%,Gemini只完成了65%还用了8小时。 跨游戏测试里,《鸣潮》100%完成率,《崩铁》92.3%,《黑悟空》85.7%。 所以整体还是靠模型,逻辑应该都是,先在3D游戏里训练通用Agent,因为相对封闭的游戏环境里,规则清晰、反馈明确。 然后实际目标是具身智能?难得就是真实世界没有血条和小地图。 论文地址:https://arxiv.org/abs/2511.08892

    作者:探索AGI发布日期:2025-11-17 11:50:00

    Agent,源神启动~ 字节整了个原神Agent,Google也发了个游戏Agent SIMA 2。 好像很牛,所以仔细瞧了瞧,到底是如何做到让Agent自己玩游戏的呢? 核心设计好像就再3点

    阅读全文
  • 文章封面

    对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    对话:王兆洋,黄小艺整理:黄小艺Memories.ai试图为未来的AI设备装上“视觉记忆”。这家由前Meta Reality Labs研究员Shawn Shen和Ben Zhou创立的公司,11月6日

    阅读全文
  • 文章封面

    AI生成乡村歌曲登顶Billboard榜首:这该让所有人愤怒

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    最近在浏览海外音乐媒体时,我注意到一个重磅消息在乡村音乐圈引发轩然大波。美国乡村音乐文化媒体Whiskey Riff发布了一篇措辞严厉的文章,标题直指"一首AI生成的乡村歌曲正在霸占Billboard

    阅读全文
  • 文章封面

    年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    文章转载于新智元年度压轴AI大戏,就在下周了!今天,一张图火爆全网:69%的人都在押注,谷歌下一代AI模型Gemini 3.0即将在下周登场。就在此时,谷歌CEO劈柴突然现身回应:两个「若有所思」的表

    阅读全文
  • 文章封面

    让千问APP当一周科研打工人:它比我想的能干,也比我想的累

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    我把自己一周的博士日常全塞进了千问 APP——读论文、啃图表、跑实验、写 related work、救火 debug……结果用着用着,我突然有点怀疑:这手机里的模型,可能比我更像个 PhD。这两年,大

    阅读全文
  • 文章封面

    双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    引言视觉-语言导航(Vision-and-Language Navigation, VLN)作为具身智能的关键研究领域,旨在赋予智能体遵循自然语言指令在未知三维环境中导航的能力。近年来,多模态大语言模

    阅读全文
  • 文章封面

    千问APP来咯!会聊天,能办事,还免费!!

    作者:通义千问Qwen发布日期:2025-11-17 11:00:00

    阅读全文
  • 文章封面

    刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

    作者:APPSO发布日期:2025-11-17 10:56:23

    前几天,阿里「千问计划」被曝光。消息称,他们要基于全球性能第一的开源模型 Qwen3 打造个人 AI 助手「千问 APP」。而就在刚刚,靴子终于落地。阿里官宣千问 APP 公测版上线。除了聊天足够聪明

    阅读全文
  • 文章封面

    阿里千问 APP 来了,对标 ChatGPT,配吗?

    作者:夕小瑶科技说发布日期:2025-11-17 10:52:13

    阿里发布千问 APP,正式开启公测。这个消息我上周已经刷到了——“阿里秘密启动千问项目,全面对标 ChatGPT ”,甚至还带动了阿里港股小涨一波。周末我发现 APP Store 里已经开放下载,于是

    阅读全文
  • 文章封面

    陈天桥的AI布局再下一子,推出最强AI长记忆操作系统

    作者:钛媒体AGI发布日期:2025-11-17 10:23:19

    文|TechPulse作者|张帅本文首发于巴伦APP近日,EverMind 团队宣布正式发布其旗舰产品 EverMemOS,这是一款面向人工智能智能体的世界级长期记忆操作系统,它旨在成为未来智能体的数

    阅读全文
  • 文章封面

    AI大模型开发核心技术栈:从框架到部署的全景解析

    作者:AIGC开放社区发布日期:2025-11-17 09:25:36

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!构建未来智能的“开发者军火库”在A

    阅读全文
  • 文章封面

    VLM 实现 10%的精度提高,13.1倍加速!纽约大学新算法让视觉语言模型更小、更快、更准确

    作者:AIGC开放社区发布日期:2025-11-17 09:25:36

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!纽约大学的研究团队通过QSVD的新

    阅读全文
  • 文章封面

    开发者必学!谷歌和Kaggle推出5天免费智能体课程,5份重磅报告,解构AI智能体未来

    作者:AIGC开放社区发布日期:2025-11-17 09:25:36

    算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区,欢迎关注!谷歌与Kaggle联手,用为期5天的强化课程和5份重磅报告,为全球开发者系统性地描绘了构建AI智能体的完整蓝

    阅读全文
  • 文章封面

    GLM Coding Plan 特供版全新上线

    作者:AIGC开放社区发布日期:2025-11-17 09:25:36

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!智谱 「GLM Coding Pl

    阅读全文
  • 文章封面

    雷军连发数文回怼质疑:车好看与安全不矛盾/曝库克将于明年卸任苹果CEO/华为或将发布AI突破性技术

    作者:APPSO发布日期:2025-11-17 08:35:30

    📱iPhone 发布周期大变:每年可能会推出 6 款新机🔄曝华为将发布 AI 领域突破性技术🔬北京 6G 实验室多项进展公布🚗雷军连发多条微博:一辆车好看与安全不矛盾🤖Grok 5 或延期至明年发布📱

    阅读全文
  • 文章封面

    使用Claude Skills 快速学习一切

    作者:字节笔记本发布日期:2025-11-17 08:23:08

    如果只是把Claude Skills用来编码就真的有点暴殄天物了。Claude Code Skills 不是什么?在上面的文章中我们其实可以了解到Skills的本质是Agent的中枢,基本所有的Age

    阅读全文
  • 文章封面

    一半成本,更优性能:JustRL用"反常识"配方打破强化学习训练迷思

    作者:觉察流发布日期:2025-11-17 08:00:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在强化学习训练日益复杂化的今天,清华大学自然语言处理实验室的JustRL研究提出了一个反常识的发现:单阶段训练、固定超参

    阅读全文
  • 文章封面

    LLM为什么能替你操作电脑?4个关键技术让AI拥有"操作系统级"能力|Agent和工作流的区别就在这

    作者:AI修猫Prompt发布日期:2025-11-17 07:26:00

    如何构建一个真正意义上的“自主代理”(Agent),而不是一个“带LLM的高级工作流”? 让钢铁侠中的“贾维斯”(J.A.R.V.I.S.)真正来到现实,不仅能对话,还能调动资源、控制机械、在复杂战局

    阅读全文
  • 文章封面

    GPT-5.1:被骂 3 个月后,OpenAI 终于“认怂”了

    作者:AI信息Gap发布日期:2025-11-17 06:20:34

    三个月前,GPT 5 发布时,CEO Sam Altman 说:“这是我们最强的模型”。三个月后,OpenAI 发布 GPT 5.1,官方博客罕见地承认:“我们听到了用户的声音,真正好用的 AI 不仅

    阅读全文
  • 文章封面

    【视频版】事情为什么会踏马发展成整个样子?170页 ppt

    作者:赛博禅心发布日期:2025-11-16 22:02:21

    本内容由明浩老师提供,在电影院进行的年度暴论非常真实,笑抽了公众号回复「251101」,可获得完整 PPT先放AI总结,后面 PPT以下内容,由「飞书妙计」整理:广告(超大声):先进团队,先用飞书(

    阅读全文
  • 文章封面

    Meta宣布彻底解决RAG最大痛点:速度提升30倍,上下文窗口暴增16倍,成本直接腰斩!

    作者:PyTorch研习社发布日期:2025-11-16 21:34:18

    大家有没有这种感觉: 明明只想让大模型看10段资料,它偏偏要硬塞100段,消耗的token数像火箭一样增长,速度还慢得像乌龟?恭喜你,这个行业通病,Meta今天直接给治好了。他们刚开源了一个叫 REF

    阅读全文
  • 文章封面

    RAG 真的能“不暴露私有数据”吗?答案是:可以

    作者:PyTorch研习社发布日期:2025-11-16 21:34:18

    你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文

    阅读全文
  • 文章封面

    Pygame RPG Tutorial 9 – Collision Detection

    作者:AI大模型调参指北笔记发布日期:2025-11-16 21:00:00

    我们成功地创造了玩家和敌人两个职业。下一步是使这两个实体彼此可交互。目标很简单;玩家必须能够攻击敌人,反之亦然。在当前版本的游戏中,我们可以随心所欲地攻击敌人(反之亦然),但这对任何一方都没有影响。原

    阅读全文
上一页下一页