论文分类打榜赛Baseline:ms-swift微调InternLM实践
本文转载自书生Intern,原文来自社区投稿,作者尖米、张富才。书生大模型实战营第5期已正式启动,本期实战营新增「论文分类打榜赛」,以帮助学员更好地掌握大模型技能。本文将手把手带领大家用 ms-swi
阅读全文本文转载自书生Intern,原文来自社区投稿,作者尖米、张富才。书生大模型实战营第5期已正式启动,本期实战营新增「论文分类打榜赛」,以帮助学员更好地掌握大模型技能。本文将手把手带领大家用 ms-swi
阅读全文全文约 2300 字,预计阅读时间 6 分钟上个月底,我们熟知的那个小米新组建的 LLM-Core 团队开源了四款 MiMo-7B 系列模型。近日他们又推出了一项令人振奋的工作——开源了MiMo-VL
阅读全文本文转载自 JackCui这周,Cursor 的主设计师 Ryo Lu 在 X 上亲自分享了一条关于如何正确使用 Cursor 的实践帖,并强调了一个核心理念:使用得当 = 快速、干净的代码使用不当
阅读全文作者:洛1. 项目背景Local Deep Researcher 是一个本地化运行的 AI 研究助手,旨在通过结合大语言模型(LLM)和搜索工具,实现自动化深度研究并生成结构化报告。该项目由 Lang
阅读全文🌟 欢迎参加 Gradio & MCP 智能体主题黑客松!准备好了吗?一场以智能体 (Agent) 和模型上下文协议 (Model Context Protocol,简称 MCP) 为核心的全球在线黑
阅读全文全文约 1400 字,预计阅读时间 5 分钟在大语言模型(LLM)广泛应用的当下,如何在保证低延迟的前提下最大化吞吐量成为行业亟待解决的问题。近段时间,由新加坡国立大学(NUS)和中国科学技术大学(U
阅读全文本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效
阅读全文全文约 3200 字,预计阅读时间 9 分钟说在前面的话以往real2sim2real的叙事方式和贡献方式都是通过摸索NeRF(神经辐射场)/3DGS(3D 高斯溅射)等高质量的稠密重建技术,更好地渲
阅读全文本文由社区同学投稿导读:RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!Deepseek-R1 的成功已经证明了纯 RL
阅读全文全文约 3200 字,预计阅读时间 9 分钟近年来,大语言模型(LLMs)凭借强大的推理能力在数学问题求解、逻辑推理和智能助手等领域展现出惊人潜力。然而,复杂任务需要模型进行冗长的“链式思考”(Cha
阅读全文作者:李剑锋前言在上节课中,我们详细学习了如何利用Function Calling机制实现文本标注、情感分析和结构化信息抽取任务,展示了Function Calling在处理结构化数据方面的巨大优势。
阅读全文本文转载自 RTE 开发者社区,编者:RTE 施苏娜、傅丰元 全文约 5200 字,预计阅读时间 13 分钟前言:我们用 ListenHubAI 制作了一个3分钟的短播客,帮助大家快速了解 Proje
阅读全文作者:HowardZhangdqs资讯GoogleI/O 2025开发者大会:AI与AR的创新盛宴Google I/O 2025于5月20日至21日在加州山景城举行,聚焦人工智能(AI)、Androi
阅读全文全文约 1800 字,预计阅读时间 6 分钟随着大语言模型(Large Language Models, LLMs)在各种任务中的广泛应用,如何优化大规模请求下的成本和响应时间成为关键挑战。最近几个月
阅读全文AI资讯日报 - 05.20 洞悉AI前沿,把握技术脉搏 🚀 Omni-R1:音频问答的技术革命 MIT、IBM等研究团队联合推出Omni-R1音频问答系统,在多模态语言模型领域取得重大突破。通过G
阅读全文导读:今天试用 ListenHub AI 将日报做成播客形式,真的太惊艳了,深情并茂,效果几乎可以媲美真人了,分享给大家,我们还为大家准备了 ListenHub AI 专属邀请码。也欢迎大家关注 机智
阅读全文https://io.google/2025/谷歌 I/O 大会 2025 将于北京时间 2025 年 5 月 21 日 (周三) 凌晨 1 点开始分享 Google Key Note,Develop
阅读全文全文约 2800 字,预计阅读时间 8 分钟https://arxiv.org/pdf/2505.07773在人工智能(AI)的快速发展中,大语言模型(LLMs)凭借其强大的文本生成能力席卷了多个领域
阅读全文作者:Lilian Weng,机器之心编译学习大模型的优质博客又更新了!最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长博客《Why We T
阅读全文作者:企鹅火烈鸟🦩前言有一段时间没更新读LLM算子库系列了,这一期我们一起来看看在turbomind中的gemm操作。turbomind中的gemm是从cutlass中抽出的模版,并进行实现的过程。t
阅读全文全文约 2800 字,预计阅读时间 8 分钟在人工智能飞速发展的今天,大型语言模型(LLMs)如GitHub Copilot、ChatGPT等已成为开发者手中的“得力助手”,极大地提升了代码编写效率。
阅读全文由中国电子商会归口管理,汇集众多企业、大模型专家提供支持,智合标准中心(北京之合网络科技有限公司)组织起草的《人工智能大模型私有化部署技术实施与评价指南》团体标准(以下简称《标准》)现已正式立项。这是
阅读全文全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. MiniMax发布通用 AI 智能体平台 MiniMax Agent,实现多领域任务自动化新锐 AI 公司 MiniMax 悄然推出全新的通用
阅读全文导读:这是一篇写得比较全面的基准数据集构建论文,论文附录还开源了人工标注说明、模型评测实验软硬件环境、详细的系统和用户提示词等,希望对大家有帮助。论文和数据集链接见文末全文约 3000 字,预计阅读时
阅读全文司南评测集社区 CompassHub 作为司南评测体系的重要组成部分,旨在打造创新性的基准测试资源导航社区,提供丰富、及时、专业的评测集信息,帮助研究人员和行业人士快速搜索和使用评测集。评测集社区 C
阅读全文全文约 3500 字,预计阅读时间约 9 分钟近年来,大型语言模型(LLMs)在自然语言处理领域掀起了一场风暴,从对话生成到复杂任务推理,它们的表现令人惊叹。然而,单个模型的性能总有瓶颈,训练成本高
阅读全文作者:企鹅火烈鸟原文链接:https://research.colfax-intl.com/cutlass-tutorial-writing-gemm-kernels-using-tensor-mem
阅读全文作者:李剑锋前言继上节课我们学习了如何利用 Function Calling 完成文本标注和信息抽取任务后,本节课将围绕“从真实网页中提取结构化信息”的主题展开一次完整实战。课程分为以下三个模块:模块
阅读全文