作者empliu (Liu)
看板Stock
標題[新聞] Gemini 3 Pro Image:「Nano Banana Pro
時間Fri Nov 21 01:05:41 2025
原文標題:
Gemini 3 Pro Image:「Nano Banana Pro」重新定義 AI 影像生成
原文連結:
https://o3o.us/dKrxQ7
發布時間:November 21, 2025
記者署名:TechApple.com 編輯部
原文內容:
在生成式 AI 競爭白熱化的當下,Google DeepMind 再次拋出重磅更新。全新影像生成引
擎——Gemini 3 Pro Image,其核心驅動更是被命名為極具話題性的 「Nano Banana Pro
」。這不僅是畫質的提升,更是對「精準控制」與「工作室級品質」的一次全面宣戰。在
Google AI Studio和AI Studio已經上線,注意有部份地區未必能用。
工作室級的精準控制:從「抽卡」到「設計」
過去的 AI 繪圖往往被戲稱為「抽卡」,但在 Nano Banana Pro 的加持下,Gemini 3
Pro Image 將重點完全轉向了 「Studio-quality control(工作室級控制)」。
這款模型的核心承諾在於「對影像的每一個細節進行精細控制」。這意味著創作者不再需
要反覆嘗試隨機的 Prompt,而是能夠真正像使用專業軟體一樣,對畫面進行精確的調度
。
角色與場景的完美融合
對於敘事類創作者而言,最大的痛點莫過於角色的一致性。Gemini 3 Pro Image 在這方
面展現了強大的能力。官方資料明確指出,使用者可以 「將你的角色放入全新的場景中
,並更換新的服裝」。這一功能直接打破了過去 AI 生成中「換個場景就換張臉」的魔咒
。
更進一步,它支援 「混合多張參考圖像」,並能構建出保留了選定細節的複雜構圖。這
不僅僅是簡單的拼貼,而是能夠協助創作者 「在一系列影像中勾勒出完整的故事」。從
單圖生成進化到連貫敘事,這是 AI 進入專業工作流的關鍵一步。
突破文字與知識的邊界:海報與圖表的終極解決方案
長期以來,AI 在生成圖片中的文字時總是「力不從心」,出現亂碼或拼寫錯誤是家常便
飯。Gemini 3 Pro Image 對此進行了針對性的優化。
清晰的文字生成能力
DeepMind 強調,新模型能夠 「為海報和複雜圖表生成清晰的文字」。這對於平面設計師
和行銷人員來說是一個巨大的福音。你不僅可以直接生成帶有正確標語的海報,甚至可
以 「將你的設計翻譯成不同的在地化語言」。這意味著,一個設計稿可以快速裂變為適
應全球不同市場的版本,極大地提升了跨國行銷的效率。
基於現實世界的知識庫
除了文字,模型的「腦子」也更好用了。利用 Gemini 龐大的現實世界知識,該模型能夠
交付 「精確的結果」,這在生成 「複雜的資訊圖表」 或 「歷史精確的場景」 時尤為
重要。它不再是憑空捏造,而是基於數據和事實進行視覺化呈現,這讓它在教育和專業簡
報領域的應用潛力大增。
強大的後期編輯流:修復、光影與混合
Gemini 3 Pro Image 不僅是一個生成器,更是一個強大的編輯器。它引入了進階的創意
工作流支援,讓使用者可以 「測試想法、創建引人注目的設計並製作原型」。
多模態的理解與編輯
透過 「上傳圖像並分享文字指令」,使用者可以用最自然的語言與 AI 溝通。想要微調
?沒問題。你可以利用其 「多模態理解(Multimodal understanding)」 能力,對畫面
進行複雜且詳細的修改。
高階編輯功能
官方特別提到了幾個令人印象深刻的高階功能:
遮罩編輯(Masked editing): 對特定區域進行精準修改。
大幅度光影變換: 例如直接將畫面從 「白天變為黑夜」,這需要模型對光線物理有極深
的理解。
影像混合: 將不同素材無縫拼接,創造出全新的視覺體驗。
這些功能讓 Gemini 3 Pro Image 能夠承擔起「修圖師」的角色,而不僅僅是「畫師」。
誠實的技術報告:不迴避缺陷的透明度
與許多過度包裝的 AI 產品不同,DeepMind 在發布頁面上展現了難得的技術誠實,詳細
列出了模型目前的局限性。這種「自我揭短」反而增加了專業用戶的信任度。
目前的技術瓶頸
儘管冠以 “Pro” 之名,官方坦承 「並非 Gemini 生成的每張圖像都是完美的」。以下
是目前仍可能遇到的挑戰:
細節處理: 模型在處理 「小臉(small faces)」、「準確拼寫」 以及影像中的 「精
細細節」 時仍可能感到吃力。
複雜數據的誤讀: 雖然擁有豐富的知識,但在生成 「資訊圖表、標註圖表或呈現複雜數
據」 時,它可能會 「誤解資訊或產生與事實不符的結果」。官方強烈建議使用者 「務
必驗證數據驅動的輸出結果」。
語言與文化的隔閡: 雖然支援多語言翻譯,但在 「語法、拼寫、文化細微差別或成語
」 方面仍可能遇到困難。
物理邏輯的瑕疵: 在進行如「日夜變換」或「影像混合」等高階操作時,有時會產生 「
不自然的結果、視覺偽影或不連貫的場景」。
心得/評論:
Google高層前幾天就有預告
前天的Gemini 3發布只是前菜而已
今天在圖像領域發表新的香蕉Pro出來炸場了
補一個我在FB中文社群看到極可怕的案例
入門級的美編這個週末夜難眠了
漢化組/台灣出版翻譯漫畫看過吧
來自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
真的變態的可怕
下面的案例感受一下
ChatGPT 888
按摩椅廣告圖(burri3188)
https://i.imgur.com/6BOGzPH.png
https://i.imgur.com/6D04xqA.png
Threads 室內設計師 33.shan.design 拿圖做渲染
https://i.imgur.com/drW90TN.jpeg
https://i.imgur.com/zbRtybW.jpeg
廣告圖解說(burri3188)
https://i.imgur.com/X9XIaRC.png
https://i.imgur.com/iRNx1VJ.png
家常便當菜隨手拍
https://i.imgur.com/dsW95kd.png
https://i.imgur.com/zGcNZlm.png
廣告圖
https://i.imgur.com/KPFF64Z.jpeg
===
這是我自己在路邊攤拍的滷肉飯
https://i.imgur.com/eOxnl7M.png
請幫我生成專業的廣告照
https://i.imgur.com/tA6TETn.png
請讓金城武代言這碗滷肉飯
https://i.imgur.com/ohT85GX.png
其他案例
出師表+石牌
https://i.imgur.com/leh3cW7.jpeg
饒河夜市+妹子
https://i.imgur.com/GOcRyhF.png
吹風機廣告
https://i.imgur.com/NjSlNuu.png
https://i.imgur.com/QUFwmEq.png
https://i.imgur.com/2uRfcBu.png
https://i.imgur.com/bBpZPXL.jpeg
手沖咖啡圖 by Fox Hsiao
提示詞 : "請畫出一張手沖咖啡流程圖附上簡單說明,日本流行雜誌風格,但是說明文字
是台灣繁體中文"
https://i.imgur.com/EWUnPKn.png
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 212.102.40.177 (美國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1763658347.A.3FB.html
1F:推 leon1757tw : AI為什麼要加香菜 11/21 01:06
2F:推 Lenney33 : 幹嘛偷拿我的照片 11/21 01:07
3F:推 joshddd : 這邊魯豬肉了吧 11/21 01:09
4F:推 cdplay000 : 要錢嗎,免費可以用嗎 11/21 01:10
5F:→ baka1412 : 變控肉飯 11/21 01:11
https://i.imgur.com/9dDCVHZ.png
他好像很熱衷把滷肉飯變成控肉飯=_=
6F:→ cdplay000 : 如果免費,那GPT就GG 11/21 01:11
7F:推 karta018 : 可以色色嗎 11/21 01:12
8F:推 cloud1030 : NV 丸子 11/21 01:13
9F:→ orz811017 : 大安金城武表示憤怒 11/21 01:13
10F:推 fr75520 : 各方金城武集結 11/21 01:16
11F:→ lianli1024 : 這灌水太嚴重了 11/21 01:18
12F:推 cityport : 香菜也太假了吧 11/21 01:20
13F:→ cityport : 焢肉跟雞蛋也很假 11/21 01:21
14F:推 strlen : 香菜怎摸惹?香菜很好啊 11/21 01:22
15F:推 b2209187 : 這個算小控肉或紅燒肉飯,不過有些高級飯店的滷味 11/21 01:23
16F:→ b2209187 : 飯確實是這種型態 11/21 01:23
17F:推 permanent27 : 我迷人的笑容 11/21 01:23
18F:推 suPerFlyK : 做報告 超級好用 11/21 01:29
19F:推 iverboy : 生成圖,openai還是更好 11/21 01:42
20F:→ Tatsuya72 : 圖文不符,這樣拿去商業運用跟欺詐有甚麼不同? 11/21 01:42
21F:→ iverboy : 這openai只好繼續加碼了,最後會不會賣給微軟 11/21 01:42
22F:→ Tatsuya72 : 哪個客戶會接受這樣搞 不怕被告? 11/21 01:43
23F:推 baka1412 : 餓 11/21 01:54
24F:推 abcd255060 : 加香菜真讚 AI很懂! 11/21 01:55
25F:推 ksjr : 為什麼要加兩盤辣椒醬 11/21 02:23
26F:噓 a8785007 : AI 只有這種可以發揮? 11/21 02:24
補了一些案例
入門級的美編這個週末夜難眠了
漢化組/台灣翻譯漫畫看過看過吧
來自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
27F:推 shirleyEchi : 這滿滿的AI味 11/21 02:39
※ 編輯: empliu (212.102.40.177 美國), 11/21/2025 03:06:29
28F:噓 ryan8409 : 一看就是AI文 11/21 04:22
29F:推 bio5chris : 確實是grok弱點但我生成完美奶子時並不在意文字啥的 11/21 04:24
30F:推 gnnlcb : open光金城武就卡關,哪裡強 11/21 04:28
31F:推 zero00072 : 你還在宮崎駿,人家直接金城武。 11/21 05:34
32F:→ greedypeople: 現在確實是gemini最強 但就跟海浪法師說的一樣 11/21 05:59
33F:→ greedypeople: 暫時的 11/21 05:59
34F:→ ksjr : 不過3pro轉好久 雖然我免費仔 11/21 06:08
35F:噓 kevabc1 : 笑死 那滷肉飯明明就超強 肉燥飯還加魚鬆的超惡心好 11/21 06:17
36F:→ kevabc1 : 嗎(誤 11/21 06:17
37F:推 bleeza : nano banana不就是奈米屌嗎 11/21 06:26
38F:推 loleea : 會讓人失業,然後失業率上升 市場就崩了 11/21 07:35
39F:推 kausan : 美術的要掰了 11/21 08:01
40F:→ kausan : 連設計的也岌岌可危 11/21 08:02
※ error405:轉錄至看板 AI_Art 11/21 08:15
41F:→ watchmeisyou: 我照著提示詞作手沖咖啡流程圖 根本就是亂碼 11/21 09:07
42F:推 LoveSports : 推 感謝分享 11/21 10:34
43F:推 hololive45P : 好強== 11/21 10:34
44F:推 dawsonliu : 確實很強 11/21 11:37
45F:推 rugia813 : openai現在至少還有sora2領先 11/21 11:47