我常用來生圖的工具有 Gemini、Sora、Image Creator、Grok等,還可以把生成的圖片,直接再生成影片。這真是老師教學備課的好幫手啊!
而微軟推出了 MAI-Image-1 的圖像生成模型,並且已經可以在 Copilot 和 Image Creator 中使用。
MAI 是 Microsoft AI 的縮寫。MAI-Image-1 的主要特點和用途包括:
👍內部研發:這是微軟首次完全獨立於合作夥伴(如 OpenAI 的 DALL-E 3)自行訓練和開發的圖像生成模型。
👍逼真影像:該模型擅長生成高度逼真的影像(Photorealistic imagery),特別是在處理自然光影、反射和風景方面表現出色。
👍整合至 Copilot:MAI-Image-1 已經開始整合進微軟的各種產品中,包括 Microsoft Copilot 和 Bing Image Creator。
👍速度與效率:微軟聲稱此模型比許多現有的大型模型更快、更有效率。
👍避免通用風格:在訓練過程中,微軟諮詢了創意產業專業人士的意見,旨在避免生成過於重複或千篇一律的通用風格圖片,提供更多視覺多樣性。
在 Image Creator(https://www.bing.com/images/create)中選取:MAI-Image-1 模型,輸入提示詞,例如:夜晚的大地,閃電劃過天際。。
結果如下:
例如,提示詞:桌上有茶杯,茶杯中有熱茶,熱茶正冒著熱氣。
你也可以直接將圖改作為影片:(有次數限制)
原圖被轉換為影片動畫效果,也可以下載為影片檔(MP4)。
目前還無法產生含有中文字的圖像,但是現在,各家繪圖都開始提供直接轉影片功能。
例如:Sora。產生圖片後,點選:Creator Video,隨即會轉成影片。
產生的影片可以再編輯,只要輸入編輯提示詞,可以重複的編修影片。
例如,在 Grok(https://grok.com/)中繪製圖片後,直接點選:製作影片。也可以透過編輯的提示詞來生成影片。
轉成影片的度很快!
如果,以去背的效果來看,在 Sora 的表現不錯,例如,提示詞:
背景透明效果,一顆石頭刻成的貓頭鷹的正面,雕刻的紋路深刻並且有著鮮豔的色彩,和石頭的原色有著完美的搭配,明亮又和諧的光影展現立體感。
其他 Image Creator、Gemini、Grok 等,都無法提供有效的去背圖案。
(Image Creator)
(Grok)
如果使用以下的提示詞繪製圖像:
🎨 畫面構圖
畫幅比例:正方形
構圖角度:側面特寫(約五分之四臉)
相機位置:畫面左上方,向下拍攝右下方
鏡頭焦段:33mm
景深設定:淺景深(部分臉部與髮梢略微虛化)
👧 角色特徵
性別與形象:女孩
眼睛:大而靈活的粉紅色眼睛,閃爍明亮光芒
睫毛:長而濃密
髮型與顏色:柔順、垂落於額前的淺色頭髮,髮梢虛化
肌膚質感:光滑細緻,帶有淡淡紅暈與逼真質感
💡 光影效果
光源方向:明亮的側光(電影式打光)
光影對比:顴骨、鼻樑、嘴唇處具強烈明暗對比與柔和陰影
光感氛圍:明亮閃耀,增強立體感與戲劇張力
🌈 色彩與氛圍
色調:鮮豔飽和但保持自然
氛圍:夢幻、細膩且具現實感
整體風格:動漫風格融合電影寫實主義
📷 視覺焦點與效果
主體焦點:臉部光影與眼睛表情
輔助效果:部分臉部與頭髮虛化以增強景深
整體感受:生動、立體、具有電影感與細節層次
(Grok)
(Sora)
(Image Creator)
(Gemini)
