全行业盯了两年的编程能力榜,今天退役!OpenAI 停用 SWE-bench Verified:未来标准将看 AI 能顶替多少程序员?
作者 | Tina 过去两年,行业几乎都盯着同一张榜单追分、比排名、算差距;但从今天起,这套玩法可能要告一段落了。今天,OpenAI 正式宣布 SWE-bench Verified“退役”。几小时前,
阅读全文作者 | Tina 过去两年,行业几乎都盯着同一张榜单追分、比排名、算差距;但从今天起,这套玩法可能要告一段落了。今天,OpenAI 正式宣布 SWE-bench Verified“退役”。几小时前,
阅读全文机器之心编辑部在全球具身智能领域的顶级权威评测 WorldArena 榜单中,清华陈建宇(星动纪元创始人)团队联合斯坦福 Chelsea Finn(PI 创始人) 团队研发的 Ctrl-World 世
阅读全文编辑|冷猫去年 7 月的 IMO 数学奥林匹克竞赛中,两大人工智能公司抢夺竞赛「金牌」成绩的闹剧搞得沸沸扬扬。当时 OpenAI 和 谷歌 同时声称取得竞赛金牌,而 OpenAI 因绕过官方竞赛规则提
阅读全文没有永远的东家,只有永远的 offer。就在刚刚,据 The Information 报道,七个月前刚加入 Meta 的技术大牛庞若鸣(Ruoming Pang),在上周悄悄加入了 OpenAI。扎克
阅读全文图片来源:Lenny's PodcastZ Highlights:我的代码如今100%由Claude Code编写,从11月起就没手动编辑过任何一行,工程师的个人生产效率也因此提升了200%,编码在很
阅读全文图片来源:techcrunch Anthropic 周三宣布已收购 Vercept,这家 AI 初创公司团队核心成员与西雅图科技界的多家知名企业渊源深厚。此次收购是继去年 12 月 Anthropic
阅读全文图片来源:Gushwork随着AI 搜索工具重塑企业在线上被发现的方式,印度初创企业 Gushwork 正帮助公司从 ChatGPT、Gemini 和 Perplexity 等平台捕获客户——其早期增
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】这个春节,港股AI认购王诞生!当人人追逐Agent风口,海致科技却押注「流程自动化」:企业真正需要的,不是会聊天的AI,而是能把业务跑通
阅读全文新智元报道 编辑:桃子【新智元导读】OpenClaw被谷歌封禁之后,Perplexity扔出深水炸弹,重磅上线Perplexity Computer,让全球19个顶尖AI集体打工,全程不用动手。
阅读全文新智元报道 编辑:LRST【新智元导读】现有的具身智能大多是「你说我做」的被动响应者。如何让机器人像人类一样拥有「主动性」?北京大学VCL实验室针对当前具身智能体「被动响应」的局限,提出了一个基
阅读全文离谱,昨天晚上OpenAI又扔了一颗炸弹。一份全新的AI威胁报告,曝光了全球利用AI干坏事的流水线。从柬埔寨杀猪盘,伪装FBI战片,再到deepfake视频招募间谍。而且报告直接指名道姓,让中文互联网
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!模型性能极限突破放缓,但模型进化依
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!自从Skills推出,智能体像插上
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!最优秀的初创企业已经开始用电来替代
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!⚠️席位告急!无补位、不追加,抢完
阅读全文作者|Yoky邮箱|yokyliu@pingwest.com春节刚过,互联网圈最熟悉的“价格战”和“百亿补贴”战火,终于烧到了AI Coding领域。在这个曾经被海外巨头和明星独角兽统治的赛道里,阿里
阅读全文2026年2月24日,OpenAI首席运营官Brad Lightcap在接受《经济时报》专访时宣称:2026年将是AI大规模落地的元年。与此同时,OpenAI刚刚发布了面向企业的"Frontier"平
阅读全文文章转载于字母AI人红是非多,自OpenClaw爆火以后它就不断遭受争议,现如今谷歌打响了反OpenClaw的第一枪。谷歌DeepMind工程师、前Windsurf CEO瓦伦·莫汉(Varun Mo
阅读全文当我们把 OpenClaw 连进 MiniMax 专家 Agent。👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon春节前,各大 AI 厂商该发模型的都发了,各种行动一起上,很像是「节前
阅读全文图片由AI生成▎一个AI与未来社会的对话。文|LCC_Beta版作者|MiroThinker dr.miromind.ai本文首发于钛媒体APP钛媒体AGI注:最近 Citrini Research
阅读全文有一说一,Anthropic这家公司虽然贱不喽嗖的,但是做产品,是真的好。。。导致我天天一边骂他,一边用它,常常觉得我天天打脸自己。昨天刚骂完,今天又真香了。。。原因是,昨天凌晨,Claude Cod
阅读全文最近 AI 圈最火的一个新词,叫"SaaSpocalypse",SaaS 末日。这两周,Claude Code 上了个 COBOL 现代化功能,IBM 当天暴跌 13%;又上了个安全扫描功能,一口气翻
阅读全文📱6999 元起,三星 S26 系列正式发布🙇♂️腾讯元宝就辱骂用户道歉🛥投资 50 亿元,刘强东宣布造游艇🚫魅族被曝手机业务已实质性停摆💹英伟达新财报公布:继续增长,营收破 681 亿🔒Anthr
阅读全文2月23日,Anthropic(Claude的母公司)突然发了一篇很正式的博客,标题大概就是“我们发现了针对Claude的工业规模蒸馏攻击”。他们指名道姓点了三家中国AI公司:DeepSeek、Moo
阅读全文话接上文。谷歌大规模封禁了用订阅令牌接入 OpenClaw 的用户,249 美元说没就没。Anthropic 也更新了条款,明确禁止用 Claude 订阅账号登录第三方工具。订阅套餐这条路,基本堵死。
阅读全文B端AI交付的真正壁垒:不是技术,是信任工程做了几个月B端AI交付,我越来越确信一件事:技术能力不是核心壁垒。你能做数据治理,你的竞争对手也能。你能搭AI客服,隔壁团队也能。模型在那摆着,API谁都能
阅读全文刚刚,Anthropic 官宣收购 Vercept,要给 Claude 的 Computer Use 能力加把火。Vercept 是一家西雅图的 AI 初创公司,去年 9 月成立,团队只有 10 个人
阅读全文用过 AI 的我们都会有种感受:不管你问什么,AI 都能给你一个像模像样的回答。问它一加一等于几,它能回答。问它宇宙的终极意义,它也能回答。问它一个完全不成立的问题,它还是能回答,而且答得特别认真。这
阅读全文今年除夕,豆包通过总台春晚,送出了超过10万份科技好礼,均搭载了豆包大模型。2月16日当晚开始,大家陆续收到了礼物。我们联系到几位中奖的朋友,请他们分享自己的故事。喜欢拍视频的农村阿姨收到了运动相机,
阅读全文图片由AI生成近年来,得益于大语言模型(LLM)的强大理解能力,导航智能体在单一任务上已表现出色。然而,一个根本性挑战浮出水面:当智能体需要学习一系列新任务时,比如先学习在A公寓中根据详细步骤导航(V
阅读全文