Google 在最新的文章中分享了如何在 Gemini 應用程式中獲得更佳圖像生成與編輯效果的技巧(參考文章)。
https://blog.google/products/gemini/image-generation-prompting-tips/
我想利用 Gemini 的 Gem,參考 Google 提供的圖像生成技巧來產生繪圖提示詞,可以依照以下步驟進行:
1. 利用 ChatGPT 協助撰寫指令
先告訴 ChatGPT 你想要生成的畫面內容、風格或氛圍。ChatGPT 會根據 Google 建議的技巧(例如:具體描述、明確指定風格、強調細節與構圖)來幫你優化生成用的提示詞草稿。
2. 將指令交給 Gemini Gem
把 ChatGPT 產出的提示詞交給 Gemini Gem,Gemini 會進一步生成專為繪圖最佳化的版本。這樣能確保輸出的提示詞符合 Gemini 的理解與最佳生成方式。
3. 使用最終提示詞來繪圖
把 Gemini Gem 生成的提示詞再丟回 Gemini,直接產生圖像。或者,你也能將同樣的提示詞交給 ChatGPT(若支援繪圖)來嘗試生成,做交叉比較。
參考以下做法:
首先,我想將網頁內容翻譯成中文。
然後,將文字內容複製到 Word 文件中,並且儲存成 PDF 檔。
接著,上傳給 ChatGPT,並使用以下的提示詞:
提據這個檔案內容(Gemini),為我產生使用在Gemini的Gem中,當輸入一個想法時,可以產生適當提示詞的動作說明內容。
ChatGPT 提供給我一些結果:(參考:https://chatgpt.com/share/68df168f-0958-8008-b422-94883d06b418)
接著,複製 ChatGPT 給的回覆內容,來到了 Gemini 中並且新增一個 Gem。
先為這個 Gem 命名,本例:Gemini繪圖提示詞產生器。再將 ChatGPT 給的內容,貼至「說明內容」區中。完成後即可使用。
來看看使用效果。
在這個 Gem 中輸入「 一個運動員和一隻豹賽跑 」。得到以下結果:
主提示
一位肌肉發達的男性短跑運動員與一隻成年獵豹,低角度廣角鏡頭,正在非洲草原的泥土跑道上並肩全速衝刺,運動員表情專注;場景在黃昏時分,戲劇性的金色逆光拉出長長的影子;整體風格為超寫實動態攝影;重點細節:運動員身上的汗珠、緊繃的肌肉線條、獵豹清晰的斑點、腳下飛揚的塵土。
可選風格版
• 版本 A(慢速快門追焦): 一名頂尖運動員與獵豹在賽道上競速,慢速快門追焦攝影;運動員與獵豹的臉部與軀幹保持清晰,背景與四肢則呈現高速動態模糊;光線為明亮的日光,強調速度感與力量;整體為體育雜誌封面風格。
• 版本 B(賽前對峙): 一名短跑選手與一隻獵豹在起跑線上準備,特寫鏡頭,專注於他們蓄勢待發的眼神與緊繃的身體;場景在專業運動場的跑道上,清晨的冷色調光線;黑色電影風格,高對比光影;重點細節:起跑器、獵豹爪子緊抓地面、運動員專注的眼神、空氣中的呵氣。
後續微調指令
•「把運動員的背心改成亮紅色」
•「把背景的樹木移除,換成更開闊的草原」
•「把光線調成正午的強烈頂光」
來看看 Gemini 利用這些提示詞繪製的圖片效果:
另一個(版本 B(賽前對峙))
你可以使用後續的調整指令繼續創作,也可以重新使用這個 Gem,它也會提供新的繪圖提示詞給你。
