Nano Banana Pro 好玩。 这几天,奥特曼的日子可能不太好过,专业角度客观分析一下Gemini3 和 Nano Banana Pro。 先说 Nano Banana Pro 把,生成的图好看是基本,分辨率4K。 但这玩意他是一个披着画画的推理模型。 画之前,会先思考。 比如说物理模拟,光从哪来,影子怎么投,人物动作。 已经不是过去靠概率拼像素的时代了,先预演,在把照片拍给你。 所以我们可以看到了,各种,完美处理多格漫画, 非常的连续,把气泡里的英文翻译成中文,还能完美地填回去。 还有一个被所有人低估的一个功能, Grounding with Search。 说白了,就是可以先搜索,把实时的数据,放在预演里边。 谷歌本身掌握着全球最大的实时知识库(Search),又有最强多模态模型,还有硬件,这似乎有点恐怖,3季度巴菲特都开始买谷歌了。 从Gemini3 ,来看 Scaling law, 为什么这玩意又行了? 从Gemini开发大佬的twitter说的,就是暴力 Scaling Up。Scaling Law 根本没失效,失效的只是你们数据不够了。 马斯克在搞grok wiki,就是因为xAI的数据太脏了,洗不出来。而Google有全球最庞大的高质量私有数据。 Gemini 3 Pro 在预训练和后训练阶段都拉满了 Scaling。虽然感觉复杂代码上似乎还比不上Anthropic,通用认知,世界模型,已经利用数据优势构筑了护城河。 Unseen, Unknown. 最后说个实用的。Nano Banana Pro 的 Prompt 逻辑也变了。 Google 的产品经理 Bea Alessio 给了一套公式: 主体 + 构图 + 动作 + 场景 + 风格 + 编辑指令 它允许你像剪辑视频一样,输入14张图,保持角色一致,然后随意调整光影、角度。 Google 在告诉世界:通往 AGI 的路,必须是原生多模态。 一个能看、能听、能查搜索、还能逻辑自洽的模型,才配叫 AGI。 这才是 AI Native 该有的样子。
Nano Banana Pro 好玩。 这几天,奥特曼的日子可能不太好过,专业角度客观分析一下Gemini3 和 Nano Banana Pro。 先说 Nano Banana Pro 把,生成的
阅读全文