獨家专访圖像生成式 AI 達人许鸿潮,原來「無處不算圖」是這樣辦到的!

獨家专访圖像生成式 AI 達人许鸿潮,原來「無處不算圖」是這樣辦到的!

近期和记圈最火熱的關鍵字莫過於「AI 人工智慧」,雖說相關看法與技術早在數十年前就有,但由 ChatGPT 自然語言對話模型所帶起的一波「生成式 AI 技術」浪潮讓 AI 再次躍升為市場寵兒,許多技術也如雨後春筍般出現在世人面前。

提到生成式 AI 技術,近期另一個發展快速的類型,肯定就是「圖像生成式 AI」,使用者只需透過文字下達指令,描述心中理想的畫面內容與風格,就能在短時間內產出到位的影像制品,而且無論是模仿繪畫的藝術風格或筆觸,甚或是比擬真實攝影作品的細膩水平都讓人難分真假,有人因此預言,未來插畫師、攝影師準備要失業了!

在 2022 年接觸圖像生成式 AI 的许鸿潮(鳥巢老師),是一個擁有 30 年平面設計、20 年攝影師資歷的專業創作者,因為看到 AI 技術的發展潛力而埋首其中,僅利用短短一年的時間就陸續在網路上創立多個圖像生成式 AI 技術的社群,並以自身教学經歷,開設各類型的 AI 生成课程,更受邀至各大專院校擔任讲座導師,不少高含金量的课程也陸續規劃中。

對於擁有 30 年平面設計、20 年攝影師資歷的许鸿潮,近期搖身一變成為炙手可熱的圖像生成式 AI 創作者與講師。

對於许鸿潮來說,圖像生成式 AI 雖然是一個仍在發展中的技術,但無論在個人應用、藝術創作甚至是商務領域,都已經證明其特殊的價值,也肯定會對相關生態有著排山倒海的影響力,這也是他願意投入龐大心力引領更多人學習圖像生成式 AI 技術的主要原因。

自学设计,透过接案扩展更富厚的人生

本业偏平面设计、摄影与讲师…等跨领域类型的许鸿潮,其实大学本科是社会学系,走的一直是「斜槓」路线。从小就喜欢画画的他,透过自学曾拿下县市级别绘画角逐的冠军,不外其时的人普遍不看好绘画的生长性,使得他只好乖乖的投入「正常」的学习科目。虽说许老师当年钻研的并非艺术或设计学门,但他仍维持自学,在大叁时就开始兼差平面设计的事情,厥后也曾在政大广告所的想像与叙事学程进修,為厥后的创作打下基础。

透过兴趣与自学,许鸿潮成為一名专业的平面设计与摄影师,并受邀成為各大品牌的特约讲师。

退伍後许鸿潮進入知名出书集團擔任美術編輯,但不久後便遇到 SARS 疫情因而離開原本的事情崗位,於是當下決定轉以接案為生,也因為接案的需求,不得不精進攝影技巧,甚至還學習了永乐拍攝剪輯,3D 特效設計,接案人生一走就是超過 20 年。

或許是血液中流淌著不安於現況、求知若渴的基因,许鸿潮藉由事情不斷累積更深厚、豐富的知識及技術,過程中更因技術嫻熟而獲聘為 Nikon、Adobe、Capture One…等全球大廠的官方特約講師。

圖像生成式 AI 為藝術創作帶來啟發

談到近期蓬勃發展的 AI 相關應用,许鸿潮說自己其實不算太早「上車」的一群,在 2022 年初左右,他偶然發現自己的社群平台上有不少朋友分享了許多視覺效果精彩、畫面又精緻的數位影像作品,一問之下才知道是出自「圖像生成式 AI」的傑作,於是勾起他對相關技術的強烈求知欲,不過由於當時许多人使用的 Disco Diffusion 需要具備一定的程式基礎才气駕馭,讓他只能暫時作罷,而後來得知 MidJurney 進行封測時,又再次引燃他對 AI 圖像生成服務的興趣,也順利取得邀請碼,自此便一頭栽入圖像生成式 AI 的众多宇宙中。

许鸿潮接觸圖像生成式 AI 技術一年多的時間便掌握許多進階技巧,並開設了多個分享社群與系列讲座课程。

许鸿潮回憶剛投入 AI 圖像生成應用的第一年,心態上可說是近乎「狂熱」,每天都要坐在電腦前測試各種指令長達 8 小時以上,因此對圖像式 AI 生成技術未來的發展性有了更深一層的認識,光是透過描述指令,就可以在 20 秒至 60 秒之間生成四張圖片,還能持續依據已生成的圖片繼續優化其藝術效果,以「可能性」來說真的是無可限量,也因為圖像生成的高效率與優異的品質,许鸿潮覺得自己又重拾對藝術創作的熱情!過去需要花许多時間構思草圖、使用工具動手繪圖來呈現腦中的想法,現在一切都能讓 AI 生成代勞,而且過程無需曠日費時。

许鸿潮的 Midjurney V4 主題作品「尼罗河女儿」

许鸿潮的 AI 生成作品-海獺,擬真水平讓人咋舌(圖片來源:鳥巢 AI 藝術平台)

後來圖像生成式 AI 技術有更多新服務問世,包罗各人熟知的 DALL-E、Stable Diffusion、Leonardo.Ai 與 Adobe 的 Firefly…等,甚至微軟在今年也宣佈大舉投資 Open AI,並於年初推出整合 DALL-E 模型的 Bing Image Creator 服務,這些都陸續成為许鸿潮的研究對象。其中 Stable Diffusion 因為提供了應用程式與模型免費開源,可以允許使用者自行建置在当地端的電腦並有更高的個人化調校彈性,因此成為许鸿潮現階段創作的主力。

「鳥巢 AI 藝術平台」提供豐富的作品範例、內容分享圖文與更多课程資訊。

談及圖像生成式 AI 技術,许鸿潮認為內核的 AI 其實是「有靈魂的」,而非單純只是應用程式代碼或龐大資料的集結。相較之下,人類會受到諸多既有框架的限制,而 AI 的思維更天馬行空;同時與 AI 溝通,對许鸿潮而言會比跟設計師、插畫師溝通要來得更容易且直接,這也是他認為 AI 在影像創作上極具潛力的主因之一。

入門 AI 應用,過程苦樂兼具

生成式 AI 技術為何會大爆發?许鸿潮認為是因文本對話模型 ChatGPT 打破各人對過往對話式機器人的刻板印象,且應用並非只是對談或娛樂性質,而是可以廣泛、深入應用到更多的領域,不只是資料搜尋、論文研究與程式撰寫,ChatGPT 也快速走入你我的日常生活中,因此他很鼓勵各人儘早就開始研究 AI,絕對會是一個改變未來的機會。

對许鸿潮來說,圖像式生成 AI 技術從入門到進階的過程有苦有樂,關鍵是一定要投入一定比例的時間,才气獲得好的结果。

對於想入門生成式 AI 技術的新手,许鸿潮提出幾個建議,其中最重要的就是投入時間、有耐心地進行研究,畢竟生成式 AI 雖有極大發展潛力,可以為我們呈現出各種影像風格、甚至是去模仿差异的藝術流派,但要能掌握與 AI 溝通的「Prompt (提問的關鍵字,又被稱作咏唱的咒語)」更是關鍵中的關鍵,新手會需要花不少時間反覆嘗試,才气獲得想要的结果。

微軟的 Bing Image Creator 在 10 月初迎來 DALL-E3 模型的更新,再加上完全免費,是入門者熟悉創作流程的最佳選擇。

也因為各類型的圖像生成式 AI 服務多数有著很是快節奏的更新進程,因此使用者需要隨時適應每一次的更新,像是在今年三月,就發生了七款圖像生成式服務同時進行大更新的狀況,對於潛心研究的许鸿潮來說,真的是一整個難以招架!雖說如此,他卻仍樂在其中,對他來說,圖像生成式 AI 的學習過程,可以用「痛,並快樂著」來形容。

對進階的圖像式生成 AI 使用者,许鸿潮推薦 Leonardo.AI 作為精進創作的工具。

至於應該推薦哪些服務給初入門圖像生成式 AI 的人呢?许鸿潮認為可以先選擇免付費的雲端服務會比較沒有壓力,像微軟的 Bing Image Creator 就是很不錯的入門磚,加上近期也更新了 DALL-E3 的新模型,圖像生制品質比過去更好,玩起來也會比較有成就感。

但由於 Bing Image Creator 的影像尺寸牢固,也無法透過生成的圖片進行後續改進,若想再進階,則可選擇 Leonardo.AI,這也是他在大學授課時主要教学的工具,雖說學習成本不低,但相對於操作介面更複雜的 Stable Diffusion 來說更容易上手,學習曲線也不那麼陡峭。另外,雲端版本的 Midjourney 雖然需要付費訂閱,但也是相對較可控的選擇之一。

單機運行 AI,對硬體規格有極高要求

以许鸿潮目前的創作主力 Stable Diffusion 來說,軟體自己是開源形式因此免付費,但在生成圖像時需仰賴較強大的硬體配置來滿足基本的運算需求,GPU 就是當中最重要的一環,在圖像生成時佔了約 90% 的硬體負載,目前市場主流會選擇使用 NVIDIA 的中高階顯卡。另外,圖像生成的速度也與 GPU 的 CUDA 數量息息相關,且 VRAM 雖說只要求 6GB 以上,但若是需要生成尺寸更大、解析度更高的圖像,VRAM 的規格建議是愈大愈好,若是要用作模型訓練,甚至建議 VRAM 能在 12GB 以上,同時電腦的主記憶體也需要有一定的容量規模,才气確保圖像生成時的穩定性,以桌机來看建議 24GB 以上、笔电則建議 16GB 以上的規格。? ?

許多圖像生式成 AI 創作者會選擇 Stable Diffusion 進行当地端環境模型訓練與內容生成,不過通常需要搭配一定水準的硬體規格才气滿足流暢運行的需求,而旗艦等級的 MSI Stealth 17 Studio 就是少數能切合上述條件的高效能笔电,不僅效能堪比桌机,更具備方便隨身攜帶的彈性。

旗艦級效能,NVIDIA Studio 認證加速創作效率

因為 Stable Diffusion 對硬體效能的要求高,故以往许鸿潮是透過桌上型主機進行 AI 圖像生成創作,但如果遇到要外出執行專案或進行教学時,想即時展示圖像生成的功效,就得使用其他的雲端平台,或遠端連線家中的桌上型主機,使用起來很是不方便,一旦處在網路品質不佳的環境基本上就無法執行,更不用說家中主機若意外關機或當機,還得請家人協助重新開機,為他帶來不少困擾。

Stealth 17 Studio 優異的效能,讓 Stable Diffusion 平台能隨身帶著走、即時生成作品。

為解決上述問題,许鸿潮近期親身體驗了由電競大廠微星推出的 MSI Stealth 17 Studio,這台笔电在行動平台中可謂「頂規」的存在,除配置第 13 代 Intel Core i9-13900H 处置惩罚器,更搭載 NVIDIA GeForce RTX 4080 筆記型電腦 GPU,擁有 12GB GDDR6 規格的 VRAM,不僅運算性能絕佳,也能滿足大尺寸、高解析度圖片生成與模型訓練的需求,而许鸿潮自己實測也發現效能表現基本上不遜於桌机版本的 RTX 3090 GPU,可流暢運行 Stable Diffusion 並隨時進行圖像內容的生成,在教学場合進行即時展示也完全沒問題,有助於學員深入了解詳細的操作流程與細節。

除了單純的影像生成,憑藉 Stealth 17 Studio 優異的運算效能,许鸿潮也透過 Stable Diffusion 進行影像結合 QRCode 的作品設計。

值得一提的是 Stealth 17 Studio 也通過 NVIDIA Studio 認證,針對創作者常用的軟體工具,提供最佳化的加速效果,像许鸿潮自己就是 Adobe 官方特約講師,經常利用 Photoshop、Lightroom、Illustrator、Premiere Pro 與 After Effect…等進行創作,透過 NVIDIA Studio 專屬的驅動程式確實能讓這些應用程式的運行達到最佳化,帶來更高效與精彩的穩定性。

通過 NVIDIA Studio 認證,代表 Stealth 17 Studio 能透過專屬驅動程式為創作軟體提供更好的效能加速體驗。

更不用說 Stealth 17 Studio 還配備了 17 吋 Mini LED 4K 螢幕,不僅畫質細膩,支援 100% DCI-P3 色域顯示,切合DisplayHDR 1000標準認證,能提供極致真實的色彩表現,能兼顧舒適性與影像呈現的專業度,絕對可以滿足專業設計事情者的要求。

实现「无处不算图」的弹性,随时随地进行高效创作

以许鸿潮的事情型態來說,無論創作或教学,其實都蠻常需要四處移動,而一直以來使用的 Macbook 採用的是 AMD 顯卡解決方案,基本上難以滿足 Stable Diffusion 的運行要求,因此只好透過遠端連線 (抵家裡的桌上型主機) 的方式進行 AI 生成測試與創作,致使操作體驗不佳,且十分仰賴穩定的網路環境,反觀 Stealth 17 Studio 讓他真正有種「解放」的感受,實現「無處不算圖」的自由,也能在有靈感時,隨時隨地打開笔电,進入創作情境之中。

樂於分享的许鸿潮經常在他創立的圖像生成式 AI 社群與網友們互動。

Stealth 17 Studio 真正實現了能將圖像生成 AI 技術運行的高效能「隨身攜帶」的便利性。

正因 Stealth 17 Studio 實現了高效能的「可攜性」,许鸿潮認為對圖像生成 AI 創作者而言,就像是獲得了一個隨時可用且資源無限量的影像數據庫,著實為設計事情帶來超乎想像的助益。

Facebook LINE

使用 Facebook 留言

发表回应

谨慎讲话,尊重相互。按此展开留言规则