能上生产才是硬道理!Coding Agent 评测,终于开始关注过程了
今天是一期硬核的话题讨论:Coding Agent 评测。AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的 7
阅读全文今天是一期硬核的话题讨论:Coding Agent 评测。AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的 7
阅读全文OpenAI 前脚低调推出专门的翻译功能,Google 后脚就开源了专业的翻译模型。世道变了,谷歌反守为攻,OpenAI 步步为营啊!!但是,我们喜闻乐见,他们越卷,我们越开心。今天来看看这个 Tra
阅读全文新智元报道 编辑:编辑部【新智元导读】人人都在夸智能体有多强,但真正的生死考场从不是Demo现场,而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号,但这家AI已经先走了一步,趟过落
阅读全文新智元报道 编辑:定慧【新智元导读】你花大价钱买的顶级GPU,可能30%时间都在「发呆」——不是算力不够,而是数据喂不上。这个被严重低估的AI困境,正在吞噬无数企业的真金白银。今天AI算力中心正
阅读全文新智元报道 编辑:元宇【新智元导读】「3年内,我们熟悉的科学研究将不复存在!」德国物理学家Sabine Hossenfelder这句「末日预言」,戳破了所有知识工作者的安全感。AI正在攻破人类智
阅读全文用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中
阅读全文作者|Yoky邮箱|yokyliu@pingwest.com千问对自己挺狠的,或者说阿里对自己挺狠的。用一个千问,把过去二十年的阿里,变成了一个AI Agent。1月15日,千问App宣布全面接入淘宝
阅读全文作者|陆邮箱|xiaoyu@pingwest.com在很长一段时间里,性能手机往往要在“轻薄手感”和“极致续航”之间做单选题,想要旗舰级的处理器和散热,机身往往厚重如砖;想要轻薄手感,电池容量就得缩水
阅读全文文章转载于字母AI美国AI公司们,最近又开始忙着投资电厂了。近期,Meta与美国电力企业Vistra签署长期购电协议,从其旗下多座现役核电站直接采购电力;此前,Meta还与Oklo、Terra Pow
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI唯“快”不破的美团闪购,这次搞了一波AIGC技术流营销。先说结论,从已经公开的视频来看,他们算是终于回答了一个近几年被反复提起、却很少被真正解决的问题
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAI你懂OCR吗?2025年之前,可能人人都懂。但2025年之后,你还认为你真的懂OCR吗?是的,随着AI大模型研发在架构、记忆、存储等等领域的深水区创新
阅读全文MemGovern团队 投稿 量子位 | 公众号 QbitAI人类程序员碰到棘手bug通常会上网查询前辈经验。当前AI虽然开始具备联网搜索能力,但仍不能很好地从网络经验中获取修复bug的能力。让AI学
阅读全文Anthropic 刚刚发布了第四份经济指数报告,这次他们搞了个 经济基元(economic primitives) 的新概念。简单来说,就是用五个基础指标来衡量 AI 的使用情况:任务复杂度、所需教
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!像一位经验丰富的数据库工程师那样去
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!AlphaFold获得诺贝尔奖标志
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!大模型越来越强,人们开始探索用大模
阅读全文算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区,欢迎关注!1月13日,由中科算网算泥社区主编、中国工业互联网研究院参编的《AI Agent智能体技术发展报告》正式发布
阅读全文导 语最近我一直在关注 Listen Labs 这家公司,它做的是 AI 用户调研。我之所以关注它,是因为它的源起故事太经典了。它的创始人本来是做了个 C 端产品叫 BeFake,结果用户增长很快,流
阅读全文在这篇文章中,我们将探讨:多智能体(Multi-Agent)架构在什么时候变得必要四种主要模式LangChain 如何赋能我们高效地构建多智能体系统大多数 Agentic(智能体驱动)任务,最佳实践是
阅读全文面向企业生产的、成本优化且全量可观测的 GraphRAG 操作系统Agentic GraphOS | 生产可用 · 多智能体 · 思维速度级扩展在这篇文章中,你将学习如何从零开始构建一套完整、可投入生
阅读全文🔥曝苹果陷入供应链危机,全球芯片巨头争夺「玻璃布」😭西贝将大规模关停 102 家门店,贾国龙:从来不是预制菜,却遭网红恶意污蔑🥕萝卜快跑低调在全国落地近 20 城,广东就占 1/4🔝清华姚班陈立杰加盟
阅读全文上次我发布了一个新站直接抄!41,454+ 案例的SkillsLM 上线不仅提供了大量使用的Skill技能,还包括了超详情的对新手友好的Skills入门和使用教程。发布初期这个网站除了展示Skills
阅读全文Boris Cherny 在 X 上发了一条帖子,分享自己怎么用 Claude Code。740 万阅读量。Boris 是 Anthropic 的资深工程师,Claude Code 就是他做的。202
阅读全文ChatGPT Translate 悄悄上线了!这次,OpenAI 罕见地没有发布任何公告,直接在 chatgpt.com/translate 开放了一个独立的翻译页面。界面和其他翻译网站一模一样:左
阅读全文1. 体验前沿 AI 产品后的30天内,不要做重大人生决定。/ Dan Shipper 2. 预测下一个 Token 的真正标准,是你是否理解了产生它的底层现实。/ Ilya Sutskever 3.
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......关注阿里千问的读者可能都知道,就在上个月(2025 年 12 月 18 日),千问 APP 宣布
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......魅族 22 系列又要出新机了。2026 年 1 月 10 日,魅族举办了 2026 魅友新春会。
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:三明治 | 监制:罗超哥们最近看了一个LOL韩服高分段的视频,直接给我整不会了。视频里那个
阅读全文