霸榜HF第一!UltraData开源2.4T优质数据,含全球最大L3数学库
纵观人工智能的发展历程,本质上是一部“数据驱动策略与利用方式”的演进史。每一次范式跃迁,既延伸和重构了前一阶段的数据驱动策略,又演进出新的数据利用方式,从而推动模型能力的跃升与涌现。〓 数据驱动策略与
阅读全文纵观人工智能的发展历程,本质上是一部“数据驱动策略与利用方式”的演进史。每一次范式跃迁,既延伸和重构了前一阶段的数据驱动策略,又演进出新的数据利用方式,从而推动模型能力的跃升与涌现。〓 数据驱动策略与
阅读全文在大语言模型不断走向智能体化、并通过工具调用直接作用于真实世界的今天,安全问题已经不再停留在“说什么”,而是转向“会做什么”。当模型能够调用代码执行器、数据库和真实 API 时,一次看似合理的工具调用
阅读全文针对世界模型落地难题,LeCun 团队连发三文,给出从算法到工程的全栈最优解。近期,Yann LeCun 团队连发三文,重点攻关非生成式世界模型(World Models)当前面临的三大技术痛点。非生
阅读全文26 字节,13 个参数。这是让 7B 模型数学能力逼近全量微调的全部数据。下面这张看似普通的二维码,实则包含了一个名为 TinyLoRA 的微调适配器的全部参数。〓 图1. TinyLoRA 权重二
阅读全文随着多模态大模型的飞速发展,我们正处于从“固定模态对”向“任意模态转换”跨越的关键节点。我们诚邀您参加 CVPR 2026 A2A-MML Workshop!本次研讨会旨在汇聚视觉、语言、音频、3D、
阅读全文懂代码、懂审美的 AI 绘图天团,专治科研人的画图焦虑。赶论文时最让人头大的,不是算力,也不是数据,而是画图。虽然 AI 早就学会了补全代码、甚至自动设计实验,但在赶 deadline 的时候,绝大多
阅读全文多模态生成技术突飞猛进,成为目前人工智能领域的热点。Midjourney 和 Sora 等产品获得惊艳的效果,并给我们获取信息的主要途径之一——推荐系统——带来深远的影响,甚至一场底层范式的根本性变革
阅读全文近期,威立执行副总裁兼总经理Jay Flynn,威立高级副总裁兼学术出版全球负责人Liz Ferguson及威立高级副总裁兼首席营销官Anna Reeves到访中国市场,在威立北京办公室与威立全球副总
阅读全文🪄 你的 Dashboard 好看又精准吗? 也许,是时候让 AI 来严肃地打一次分了。引言:当 AI 开始 “看图思考”在这个“数据驱动决策”的时代,图表早已不是“锦上添花”的装饰——它是传递复杂信
阅读全文当你还在反复调试 Prompt 时,隔壁组已经用 Agent 把代码直接变成了顶会论文。科研中最绝望的时刻往往不是没有 idea,而是实验跑通后,对着丑陋的 Visio 架构图调配色,或者对着空白的
阅读全文在 Transformer 的训练过程中,只要稍微留心观察权重或激活值的分布,你就会发现残差流里的那个怪象:无论输入何种 token,某些固定维度的激活值始终显著高于其他维度。与此同时,Attenti
阅读全文Token 级数据清洗不仅更强,还能让攻击成本飙升 7000 倍。作为定义了 GPT-2 范式的核心人物,Alec Radford 曾向业界证明了数据规模的价值。在 2024 年离开 OpenAI 后
阅读全文直播时间:2月1日 9:00-12:20会议地点:湖州师范学院论坛信息OpenKG将于2026年2月1日举办主题为“知识增强大模型新发展”2025年度论坛。论坛由两部分组成:特邀报告部分特别邀请了来自
阅读全文2026 开年三文连发,大模型如何靠上下文实现自我进化?最近几天,MIT、ETH Zurich 和 UCLA 等团队,几乎在同一时间提交了关于 Self-Distillation 的重磅论文。虽然它们
阅读全文近年来,大语言模型在检索增强生成(RAG)和文本摘要等任务中表现出惊人的潜力。然而,“忠实度幻觉”(Faithfulness Hallucination)——即模型生成的回复与其提供的参考文档不一致或
阅读全文面试官让手写 Attention?看看这个纯 NumPy 项目,从底层彻底告别“调包侠”。Ilya Sutskever 曾给 John Carmack 开出一份 30 篇论文的书单,直言如果你能真正吃
阅读全文眼下 CVPR Rebuttal 马上截稿,ECCV 的投稿准备也该提上日程了。审稿人写道:“Your method lacks comparison with recent work XXX(202
阅读全文学术圈死亡名单?ACL 2026 投稿扒出 300 篇幻觉论文,附录直接实名挂人。如果你正看着手里的 ACL 2026 投稿,准备开始审稿工作,看到这篇题为《HalluCitation Matters
阅读全文无需真实奖励,哪怕用随机、错误的信号进行训练,大模型准确率也能大幅提升?此前,学术界已经发现了一个令人困惑的现象:像 Qwen2.5 这样的模型,即使在 RLVR(带验证奖励的强化学习)过程中给予虚假
阅读全文仅用几百 Token 读懂复杂文档?DeepSeek-OCR-2 发布:让视觉编码像人眼一样。在多模态大模型的竞赛中,文档解析始终是一个关键瓶颈。无论是早期的 CNN+RNN,还是目前主流的 ViT-
阅读全文“全局交互”几乎等同于 self-attention:每个 token 都能和所有 token 对话,效果强,但代价也直观 —— 复杂度随 token 数平方增长,分辨率一高就吃不消。现有方法大多从
阅读全文“验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。近期,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB
阅读全文通过快速视觉筛查与选择性多模态推理,实现高精度定位、低计算开销、零样本时间序列异常检测。©PaperWeekly 原创 · 作者 | 何泽林单位 | 宾夕法尼亚州立大学研究方向 | 多模态大模型论文标
阅读全文拒绝 Desk Reject,让 Claude 变身你的顶级学术合伙人。就在今天,ICML 2026 的 Abstract Deadline 正式截止。官方数据显示,今年的提交编号已经飙升到了 335
阅读全文试想一下,如果把你扔进一个从未去过的杂乱房间,只允许你快速睁眼瞥三次,紧接着就要求你把墙角那张积灰的木桌子搬走。这听起来像是对人类的刁难,却是具身智能体每天面对的真实处境。在真实世界里,机器人没有上帝
阅读全文NeurIPS 2025 惊现“填空式”造假,连 arXiv:XXXX 都不删。GPTZero 团队近日发布审查报告,在 NeurIPS 2025 已发表的 4841 篇论文中,检测出超过 50 篇包
阅读全文你是否有过这样的经历:刷到一家价格合适、评价不错的餐厅,却发现门店远在城市另一端,交通成本过高,只能无奈划走。对于生活服务类内容来说,“感兴趣”只是开始,“方便到达”才是决定下单的关键。正因如此,生活
阅读全文后 Transformer 时代,从“丢掉位置编码”到“外挂大脑”,Sakana AI 做对了什么?当 128K 甚至 1M 的长窗口成为大模型标配,大家似乎都想当然地以为,只要单纯拉长上下文窗口,长
阅读全文《自然-传感》(Nature Sensors)于2026年1月正式上线,是Nature Portfolio推出的又一本全新《自然》研究型期刊。传感器在数字化建设中随处可见,如内置于智能手表、手机、汽车
阅读全文在深度研究(DeepResearch)席卷而来的今天,我们习惯了认为,只有千亿参数的云端大模型才能处理复杂的深度调研。但今天,这个既定认知被打破了。AgentCPM-Report 正式开源。这款由清华
阅读全文