微信WFS传统TCP网络Fio跑满200Gb网卡实践
作者:微信WFS团队DeepSeek 在去年二月对外开源了 3FS,凭借基于 RDMA 的架构设计实现了极高吞吐,成为业界关注的标杆,网友纷纷复现其在 100Gb 网络下 Fio 跑满带宽的惊艳表现。
阅读全文作者:微信WFS团队DeepSeek 在去年二月对外开源了 3FS,凭借基于 RDMA 的架构设计实现了极高吞吐,成为业界关注的标杆,网友纷纷复现其在 100Gb 网络下 Fio 跑满带宽的惊艳表现。
阅读全文作者:李裕东 庞雲升 刘子健导语在信息流、短视频、电商等推荐场景中,用户真正感知的并非某一条内容的相关性,而是一整屏列表带来的「整体体验」。 为此,腾讯TRS团队在论文《HiGR: Efficient
阅读全文丨 导语 OpenClaw(原名clawdbot)突然就火了,了解后发现多终端协同的人机协同方式的jarvis正是自己的日常工作方式!在此之前,为了方便自己用 AI ,我基于 claude agent
阅读全文作者:ethanntang 、wyattyfwang引言随着大模型规模的扩展,思维链(Chain-of-Thought, CoT)已成为处理复杂推理任务的标准范式。但我们在实际应用中发现,CoT 的有
阅读全文作者:nevil丨 导语 在过去的一年里,我们已经习惯了与 ChatGPT 或 Claude 进行对话。但现在的 AI 正在从“对话框里的聊天伴侣”进化为“操作系统里的执行者”。今天向大家介绍一个近期
阅读全文腾讯混元AI Infra团队开源生产级高性能LLM推理核心算子库 HPC-Ops,该算子库基于生产环境痛点,采用 CUDA 和 CuTe 从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等
阅读全文2025年初,DeepSeek的走红让更多人明白,不仅仅是模型本身,训练和推理过程中工程上的优化同样重要。元旦假期看了朱亦博老师的一篇帖子,很受启发,2025年过去了,我想应该尝试来把亦博老师总结的2
阅读全文话题背景当技术掌握在手里,有些“随手一试”的操作,真让人倒吸凉气。今天,我们不聊前沿 AI,也不聊深度架构,而是来盘点那些——鹅厂员工“玩”过的技术恶作剧现场。它们可能代码很短,但后劲很大,以下为 9
阅读全文作者:zishanshi随着通用大模型向着agentic以及GUI理解增强的方向发展,现在Gemini 3 Flash等通用大模型已经可以直接用来搭建一个效果还不错的GUI Agent,并且实践难度大
阅读全文话题背景当AI帮你敲下那一行行“完美”代码时,有些悄悄埋下的坑是否让你倒吸凉气!今天,我们盘点那些AI Coding令人扶额的翻车现场,以及一些防坑指南,让你在AI编程时代,少走弯路,多些从容。以下为
阅读全文近年来,大模型正从能力竞赛走向工程落地,推理阶段的成本、时延与稳定性逐渐成为制约规模化应用的核心因素。在长上下文、高并发与多模态场景下,解码过程受限于算力与显存带宽,单纯依赖模型压缩或硬件堆叠的优化路
阅读全文作者:rickyshou2025 年 AI 编程工具遍地开花,但一个尴尬的现实是:工具越来越强,预期越来越高,落地却越来越难——speckit 的规范流程在企业需求的"千层套路"、海量代码面前显得理想
阅读全文作者:gray随着大语言模型和多模态技术的蓬勃发展,非结构化多模态数据处理已经成为数据处理的重要组成部分。面对海量数据与复杂模型带来的挑战,传统大数据引擎在异构资源调度、Python生态兼容性等方面的
阅读全文作者:lingnyliang在人工智能的演进历程中,大语言模型展现出了令人惊叹的文本生成能力,但其“黑箱”特性也带来了显著挑战——模型经常产生看似合理但实际错误的“幻觉”回答,缺乏透明推理过程,且无法
阅读全文作者: deyuankong"明天有个汇报,今晚必须交最终稿 PPT..." 这场景熟悉吗? 年底到了,又到了写 PPT 的"煎熬季",也许你正在为写 PPT 而绞尽脑汁、通宵达旦。这一次,你可以给
阅读全文作者:yongzheng,patrickguo在大模型满天飞的今天,我们是甘心做一个只会调用 OpenAI.chat.completions 的 API 搬运工,还是想真正弄懂那个黑盒子里到底发生了什
阅读全文引言在游戏开发中,大量可探索区域的环境与道具摆放,需要美术与关卡团队反复挑选资产、调整位置、尺度、朝向,并处理“有支撑、无穿插、留通行”等基础约束。这类工作细节密度高、迭代频繁,往往消耗大量制作时间。
阅读全文作者:悟空代码安全团队随着 AI 技术加速融入软件研发流程,AI 已经成为新时代的“代码贡献者”。在显著提升研发效率的同时,AI 生成代码也对软件安全、漏洞治理和工程责任边界提出了新的挑战。 围绕“
阅读全文2025年12月,智能视频图像编码领域两大核心赛事相继揭晓结果:在VCIP会议主办的第四届低复杂度端到端图像压缩实战赛中,腾讯香农实验室研发的腾讯神经网络编解码器TNC(Tencent Neural
阅读全文话题背景“有没有一段代码,你写过不下十次?”什么样的代码,能成为你键盘下的“肌肉记忆”?不是"Hello World",而是那些支撑起无数项目的“沉默基石”。以下为10位鹅厂同事们分享的“闭着眼睛都能
阅读全文作者:yukixxwang随着大型语言模型(LLM)驱动的自主代理(Agent)从学术走向应用,如何确保其行为的可靠性、安全性与可控性,已成为决定其能否在真实世界关键任务中落地的核心挑战。大语言模型能
阅读全文作者:jacksondeng、gcchaoguo 、haoxili 、kxingzhang 、darychen导语过往基于tab模式进行代码补全对编码效率提升的天花板较低,使用agent模式生成的代码
阅读全文作者:adacyang如何让AI智能体(Agent)像人类一样拥有持久的记忆,从而在复杂的连续任务中保持上下文感知和深度理解?这已成为构建高级智能体的核心挑战。本文将深入探讨Agent Memory的
阅读全文作者:hassonlin、davidpzxie难以查找海量库表、需求紧急复杂、重复性工作多、结果校验困难、追溯记录困难……数据分析时要如何破除这些痛点?QQ浏览器的信息流推荐架构团队基于CodeBud
阅读全文作者:huaxing本系列的文章由浅入深介绍LLM的基础知识,从大模型的使用,到原理解析,再到LLM系统实战。 本文着重介绍LLM主流架构Transformer的原理,结合我近期阅读的几本大模型原理书
阅读全文作者:chrisccai如今我们已经习惯了大模型处理复杂问题时,先进行深度思考再给出精心编排条理清晰的答案、惊叹于Agent在处理复杂任务时经过规划、执行、观察、反思的一系列处理复杂任务的通用能力。
阅读全文