静态油画秒变动态视频!西安交大等提出「无需训练」的绘画动态化新范式
随着人工智能技术的飞速发展,图像到视频(I2V)生成已成为艺术与科技融合的前沿领域。然而,现有方法在将静态绘画转化为动态视频时,仍面临两大核心挑战:(1)不动:现有模型无法准确解读和执行文本提示中的运
阅读全文随着人工智能技术的飞速发展,图像到视频(I2V)生成已成为艺术与科技融合的前沿领域。然而,现有方法在将静态绘画转化为动态视频时,仍面临两大核心挑战:(1)不动:现有模型无法准确解读和执行文本提示中的运
阅读全文本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生,导师为陈文虎教授,陈文虎教授为通讯作者。近年来,视频生成技术在动作
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海交通大学上海交通大学人工智能学院(https://sai.sjtu.edu
阅读全文Advanced Science 青年科学家奖2025开放申请!Advanced Science 青年科学家奖 (Advanced Science Young Innovator Award)面向全球
阅读全文以 DeepSeek-R1 为代表的强化学习范式,近期在语言模型领域掀起了一次“推理革命”。而这一次,轮到视频了。最近,港中文联合清华团队正式发布了首个将 “R1 范式”系统性落地到视频推理领域的模型
阅读全文基于当前观察,预测铰链物体的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。尽管现在基于 diffusion 的方法取得了很多进展,但是这些方法存在处理效率低,同时缺乏三维感
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室招聘研究型实习生,研究方向为通用Agent技术(pl
阅读全文万物皆卷的时代,升学、就业的竞争越来越激烈,想要保研、申博、进大厂,没有高质量论文在手就相当于“裸奔”!尤其是这个人人惶恐又内卷的时代,想要抓住点什么来增强安全感。有一份拿得出手的成绩——发论文的数量
阅读全文你是否想过,未来的机器人如何真正理解并完成我们日常生活中的各种复杂任务?想象一下这样的场景:你走进厨房,告诉家中的机器人:“帮我用微波炉热一下碗里的饭。”对人类来说,这似乎再简单不过,但机器人要真正理
阅读全文在 InternVL-2.5 上实现 10 倍吞吐量提升,模型性能几乎无损失。最新 1-bit 多模态大模型 KV cache 量化方案 CalibQuant 来了。通过结合后缩放和校准方法,可显著降
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!埃默里大学埃默里大学(Emory University)创建于1836年,位于
阅读全文随着人工智能领域的不断发展,深度学习模型在多个任务中展现出强大的能力,尤其是在大规模语言模型(LLMs)和多模态大语言模型(MLLMs)中。最近,DeepSeek R1 的提出引发了对强化学习(RL)
阅读全文在大语言模型(LLMs)检索增强生成(RAG)技术快速迭代的今天,一个根本性难题始终存在困扰 RAG 的可信生成:当模型参数记忆与外部检索知识冲突时,如何实现知识依赖的精准调控?目前方法只能依赖大模型
阅读全文本文深入分析了 prompt tuning 的推理机理,并针对分析结果提出了动态提示扰动的方法,提升 LLMs 在复杂推理任务中的表现。论文标题:Improving Complex Reasoning
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!微软亚洲研究院微软亚洲研究院的机器学习组致力于推动 AI 在电池领域的基础和应
阅读全文随着人工智能(AI)向通用智能(AGI)迈进,单一模态的链式思维(Chain-of-Thought,CoT)已难以应对现实世界中多源异构数据的复杂推理需求。这篇综述全面梳理了 MCoT 的理论框架、技
阅读全文引言在当前的 CAD 参数化任务中,主流方案往往仅聚焦于工程图纸的几何图层,而忽视了标注图层的重要性。上述这一局限性导致许多学术上的解决方案难以直接应用于实际工业设计流程中。为了填补学术社区中这一类数
阅读全文©作者 | 陈晓栋单位 | 中国人民大学硕士生来源 | AI Time模型剪枝是一类重要而且应用广泛的模型压缩方法,其通过移除神经网络中的冗余的结构或权重,在尽量保持模型准确度的前提下减少模型的大小,
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!字节跳动字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 A
阅读全文惨了,中科院分区表出了后,博士一区top秒变二区。。。那些期刊、会议潜规则是需要经验才能把握的。对于刚接触科研的小白来说,搞科研真的不是看看课就会搞的,有人手把手带你搞科研,比你花费大量的时间去听课有
阅读全文背景与挑战随着 ChatGPT 掀起自回归建模革命后,近年来研究者们开始探索自回归建模在视觉生成任务的应用,将视觉和文本数据统一在 “next-token prediction” 框架下。实现自回归图
阅读全文最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由 IDEA、清华大学、北京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!腾讯微信事业群负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生
阅读全文“物联网学域介绍INTERNET OF THINGS香港科技大学(广州)下设的信息枢纽所建立的物联网学域,依托于香港科技大学在无线通信与网络领域世界领先的教学和科研优势,将进一步推动中国成为物联网领域
阅读全文3月29日,在2025中关村论坛青年科学主题论坛上,深势科技联合北京科学智能研究院( AISI )正式发布了全新版本的玻尔( Bohrium )科研空间站。这一以量子力学先驱尼尔斯·玻尔命名的 AI
阅读全文在 3D 场景重建与表示领域,三维高斯(3D-GS)因为其快速的渲染速度,灵活的显式表示,易于编辑的特性,已成为了当前的主流技术。三维高斯在各种下游任务,如动态场景重建,三维语义分割,数字人等都得到了
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!上海人工智能实验室上海人工智能实验室安全团队专注于研究大语言模型、多模态大模型
阅读全文©PaperWeekly 原创 · 作者 | 苏剑林单位 | 科学空间研究方向 | NLP、神经网络众所周知,完整训练一次大型 LLM 的成本是昂贵的,这就决定了我们不可能直接在大型 LLM 上反复测
阅读全文研究背景研究问题:这篇文章要解决的问题是如何在统一框架下对基于图的检索增强生成(RAG)方法进行系统的比较和分析。具体来说,现有的基于图的 RAG 方法没有在同一实验设置下进行系统的比较。研究难点:该
阅读全文©作者 | 吴旻烨、戴海钊等单位 | 鲁汶大学、上海科技大学来源 | 机器之心三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结
阅读全文