全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    修图界ChatGPT诞生!JarvisArt:解放人类艺术创造力——智能修图智能体重塑专业摄影后期

    作者:机智流发布日期:2025-07-04 21:30:00

    本文来自社区同学投稿,作者:Yunlong Lin 等项目主页: https://jarvisart.vercel.app/国内主页:https://www.jarvisart.site/论文全文:

    阅读全文
  • 文章封面

    GitHub 6月月榜:AI智能体浪潮来袭,开源CRM与本地化LLM成新宠

    作者:机智流发布日期:2025-07-04 21:30:00

    作者:InternLM、Qwen 等 LLM今日趋势概括2025年7月4日,我们观察到GitHub的开源趋势正经历一场深刻的演变。6 月,人工智能领域无疑是技术创新的绝对核心,其发展已超越了基础模型的

    阅读全文
  • 文章封面

    中山大学&华为联合提出 Issue Resolution 数据集构建神器SWE-Factory:每条只要$0.024

    作者:机智流发布日期:2025-07-03 23:48:21

    本文来自社区同学投稿全文约 3200 字,预计阅读时间 9 分钟还在为构建高质量的软件 Issue 解决数据集而头疼吗?传统方法不仅耗时耗力,成本更是高得离谱。中山大学和华为联合提出全新的低成本开源解

    阅读全文
  • 文章封面

    0703资讯:智谱开源新一代通用视觉语言推理模型|Cursor上线网页与移动端智能体|百度发布视频生成模型MuseSteamer

    作者:机智流发布日期:2025-07-03 23:48:21

    作者:yanbo全文约 600 字,预计阅读时间 3 分钟新闻资讯1. 智谱开源GLM-4.1V-Thinking视觉模型,推出“Agent应用空间”扶持计划智谱AI发布两项重磅成果:一是开源新一代通

    阅读全文
  • 文章封面

    打脸李彦宏,文心4.5技术报告详解来了!

    作者:机智流发布日期:2025-06-30 23:01:46

    编辑:机智流编辑部和被奴役的AI小编全文约4000字,阅读时间约11分钟。李彦宏在2024年WAIC的发言不知道还有小伙伴们记得去年李彦宏去年是怎么评价开源大模型的吗?今年2月百步旗下文心官号的文章大

    阅读全文
  • 文章封面

    深度解析 Gemma 3n 端侧全能模型:手机端 60FPS 视频实时解析

    作者:机智流发布日期:2025-06-27 23:11:02

    编辑:机智流编辑部和被奴役的AI全文约4000字,阅读时间8分钟。今天稍早,我们介绍了 Google 刚刚推出的全新开源模型 Gemma 3n。这是一个多模态开源模型,支持图像、语音、视频和文本输入,

    阅读全文
  • 文章封面

    0627资讯:FLUX.1 Kontext图像生成与编辑模型|快手发布多模态大模型|小米发布AI眼镜,进军可穿戴智能视觉设备市场

    作者:机智流发布日期:2025-06-27 23:11:02

    全文约 1200 字,预计阅读时间 3 分钟新闻资讯1. Black Forest Labs发布FLUX.1 Kontext图像生成与编辑模型,支持上下文感知处理Black Forest Labs推

    阅读全文
  • 文章封面

    被试卷折磨的老师,终于靠大模型爽了一次!

    作者:机智流发布日期:2025-06-26 20:38:32

    作者:李剑锋前言又到了一年一度的期末了,学生们都在忙忙碌碌的背书准备着接下来的考试,而老师们也是严阵以待,准备着如何快速的批改好试卷, 然后千辛万苦的从残破不堪的试卷中找到学生的得分点,最后将学生从挂

    阅读全文
  • 文章封面

    Kimi Research 初探 - 科学哄女友指南

    作者:机智流发布日期:2025-06-22 23:01:15

    作者:企鹅火烈鸟🦩前言最近Kimi发布了他们的新Agent,是对标国外大厂Deep Research的Agent。我们在发布之后马上拿到了Kimi Research的权限,并且尝试了很多种不同的风格的

    阅读全文
  • 文章封面

    国产开源模型全军覆没!EPFL与谷歌DeepMind联手打造WikiMixQA,揭示VLLM在长文档理解和推理中的巨大不足

    作者:机智流发布日期:2025-06-21 23:08:07

    作者:InternLM、Qwen 等 LLM全文约 2300 字,预计阅读 6 分钟在信息爆炸的时代,文档作为知识传递的核心载体,常以复杂的排版承载着文本、表格、图表等多种形式的复杂信息。如何让人工智

    阅读全文
  • 文章封面

    0621 晚报:DeepSeek推出DeepSite V2|腾讯AI Lab开源音乐生成大模型SongGeneration

    作者:机智流发布日期:2025-06-21 23:08:07

    作者:yanbo全文约 800 字,预计阅读时间 3 分钟新闻资讯MiniMax发布Hailuo Video Agent,简化视频创作流程MiniMax 正式推出视频创作智能体 Hailuo Vide

    阅读全文
  • 文章封面

    手把手带你入门 HTML:打造你的第一个网页!

    作者:机智流发布日期:2025-06-19 23:10:22

    作者:李剑锋前言之前做前端页面的时候,一直以来都是拿Python的快速前端框架Gradio来做。但是用多了就觉得,Gradio做的界面其实相对比较朴素,而且很多时候并不能满足自己的需求。因此就想着学一

    阅读全文
  • 文章封面

    CVPR2025 | 清北等提出UniAct:通过构建通用动作空间,让具身智能通用化离我们又近了一步

    作者:机智流发布日期:2025-06-18 21:40:37

    作者:周善斌全文约 2400 字,预计阅读时间 6 分钟在自然语言处理与计算机视觉领域,大规模基础模型通过互联网级数据训练展现出强大的泛化能力。然而,这一成功经验在具身智能领域却遭遇显著挑战:不同机器

    阅读全文
  • 文章封面

    0618资讯:MiniMax、月之暗面相继强势开源新模型 | Kling 2.1新增视频同步音频生成功能

    作者:机智流发布日期:2025-06-18 21:40:37

    全文约 1400 字,预计阅读时间 3 分钟新闻资讯1. MiniMax发布MiniMax-M1开源混合注意力推理模型2025年6月17日,上海AI公司MiniMax正式开源其混合注意力推理模型Min

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 BestServe:LLM 服务吞吐量提升 30%背后的三大创新

    作者:机智流发布日期:2025-06-17 21:45:07

    全文约 1600 字,预计阅读时间 5 分钟在大语言模型(LLM)日益普及的今天,如何高效地为数百万用户提供服务成为了一个关键挑战。传统的试错方法不仅耗时且成本高昂,而现有的理论模型又难以准确预测复杂

    阅读全文
  • 文章封面

    洛桑联邦理工学院提出MEMOIR:如何借助残差记忆模块对LLM实现可靠且可拓展的终生知识编辑

    作者:机智流发布日期:2025-06-15 22:42:46

    作者:InternLM、Qwen 等 LLM全文约 4400 字,预计阅读时间 12 分钟近年来,大语言模型(LLMs)凭借其强大的语言理解和生成能力席卷了AI领域。然而,随着知识的快速迭代和实时更新

    阅读全文
  • 文章封面

    LangChain 本地化应用探索(二):修复输出异常与模板适配策略

    作者:机智流发布日期:2025-06-12 22:39:59

    全文约 2000 字,预计阅读时间 5 分钟前言在上一次的课程当中,我们尝试的进行了在LangChain中接入ModelScope模型,但是在接入中,我们会发现与模型的对话有些许的问题,包括模型回复时

    阅读全文
  • 文章封面

    直击强化学习前沿,RL专场来袭丨AI Insight Talk直播预告

    作者:机智流发布日期:2025-06-12 22:39:59

    在知识爆炸、信息过载的时代,如何洞悉 AI 领域前沿趋势?OpenMMLab 联合 Hugging Face、ModelScope、知乎及机智流等重磅推出 AI Insight Talk,邀请「强化学

    阅读全文
  • 文章封面

    知乎大V夕小瑶团队推出首个A2A范式Agent!重新定义AI Agent:你不是在用工具,而是在领导团队

    作者:机智流发布日期:2025-06-11 23:41:18

    作者:羰汤羰和 Teamo AI首先严正声明,今天这篇我们没有收广告费(广告位招租),但我们也确实要到了官方的内测邀请码,我们会在文末公布邀请码获取方式。全文约 5200 字,预计阅读时间 10 分钟

    阅读全文
  • 文章封面

    MMAR与AudioTrust技术解读,音频大模型评测前沿进展分享 | 司南评测集社区直播预告

    作者:机智流发布日期:2025-06-10 22:02:19

    本文转载自「司南评测体系」司南评测集社区 CompassHub 作为上海人工智能实验室司南评测体系的重要组成部分,旨在打造创新性的基准测试资源导航社区,提供丰富、及时、专业的评测集信息,帮助研究人员和

    阅读全文
  • 文章封面

    0610资讯:1.93bit量化版DeepSeek-R1力压Claude 4 Sonnet | LangGraph首个稳定版发布

    作者:机智流发布日期:2025-06-10 22:02:19

    全文约 2300 字,预计阅读时间 5 分钟新闻资讯苹果 WWDC2025:设计革新与 AI 探索北京时间 6 月 10 日凌晨 1 点,苹果 WWDC25 全球开发者大会盛大举行。此次大会聚焦软件更

    阅读全文
  • 文章封面

    CVPR 2025 | 图像生成中的“思维链”博弈:DPO 与 GRPO 谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

    作者:机智流发布日期:2025-06-09 22:08:10

    本文来自社区同学投稿近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大

    阅读全文
  • 文章封面

    GitHub 日榜:5行代码构建智能体记忆、手把手教你活到150岁

    作者:机智流发布日期:2025-06-09 22:08:10

    作者:Google Gemini今日趋势概括今日GitHub趋势榜上的项目广泛分布于多个热门技术领域。人工智能与机器学习依旧是焦点,涌现了大量关于大型语言模型(LLM)优化、AI代理内存管理、检索增强

    阅读全文
  • 文章封面

    复旦大学团队推出首个CAD三视图理解基准数据集!CAD三视图理解新范式CReFT-CAD再创新SOTA!

    作者:机智流发布日期:2025-06-08 22:16:57

    本文来自社区同学投稿,作者:复旦大学牛轲引言计算机辅助设计(CAD)在现代工业制造中扮演着至关重要的角色。其中,正交投影推理作为CAD设计、制造与仿真流程的基础,其精度与可编辑性对整体工作流程至关重要

    阅读全文
  • 文章封面

    扩散模型:Diffusion models are autoencoders

    作者:机智流发布日期:2025-06-07 23:59:31

    作者:企鹅火烈鸟文章转载自:https://sander.ai/2022/01/31/diffusion.html2019年底,自从宋(Song)和埃蒙(Ermon)发表了他们的那篇重磅论文后,扩散模

    阅读全文
  • 文章封面

    智能体刷屏的背后,是 AI 应用拐点的来临?

    作者:机智流发布日期:2025-06-07 23:59:31

    随着大模型能力不断下沉,AI 的落地路径正在发生结构性变化——多模态与智能体(Agent)正重新定义“应用接入层”,成为系统级能力;与此同时,推理性能、数据体系与工具链协作,也进入新一轮重构周期。即将

    阅读全文
  • 文章封面

    CVPR 2025 最佳论文候选名单出炉!最终将花落谁家?

    作者:机智流发布日期:2025-06-06 23:47:15

    作者:InternLM、Qwen 等 LLM 和人时光飞逝, AI 界三大顶会之一的 CVPR 将在下周 6.11-6.15 于美国田纳西州纳什维尔召开。本次会议共收到 13,008 份有效投稿,最终

    阅读全文
  • 文章封面

    73%人类认同率!Video-Bench实现视频质量精准打分

    作者:机智流发布日期:2025-06-06 23:47:15

    本文来自社区同学投稿现如今,视频生成技术正以前所未有的速度革新着我们的视觉内容创作方式。从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。如何准确评估这些

    阅读全文
  • 文章封面

    LangChain 本土私有化应用探索:魔搭社区ModelScope 模型对接实践

    作者:机智流发布日期:2025-06-05 22:45:00

    作者:李剑锋简介在之前的课程中,我们主要是通过 API 的方式与 LangChain 框架进行联动。但最近在筹备自己的大模型教学系列课程时,我开始探索:能不能将国内 ModelScope 平台上的开源

    阅读全文
  • 文章封面

    CVPR2025 | 深度解析BIP3D: 如何在具身智能中桥接2D图像和3D感知

    作者:机智流发布日期:2025-06-04 23:23:55

    全文约 3000 字,预计阅读时间 8 分钟原文链接:https://arxiv.org/pdf/2411.14869在具身智能系统中,3D 感知算法是极为关键的存在,它宛如智能体的 “慧眼”,助力其

    阅读全文
上一页下一页