所有語言
分享
2024 年 1 月 5 日,“智求共贏・中國 AIGC 產業應用峰會暨無界 AI 生態合作夥伴大會”在杭州未來科技城召開。大會由杭州未來科技城管委會、餘杭區科技局和餘杭區企業(人才)綜合服務中心聯合指導,時戳科技主辦,AI 新智界提供媒體特別支持。
無界 AI 內容生態中心負責人趙傑誠在《實用型 AIGC 的多維度解決方案》主題演講中分享了無界 AI 是如何像解應用題一樣解決 AI 圖片生成的問題。他表示,只有把用戶提出的“飄在天上”的需求以細緻、穩定並且精確的方式落地,才能讓 AIGC 在實操層面成為一個非常好用的工具。
以下是 AI 新智界整理的演講內容,為方便閱讀已進行部分刪減:
我是無界 AI 內容生態中心的負責人趙傑誠,今天跟大家分享一些 AI 的實用解決方案。在我之前,包括紅蜻蜓的老總、各位領導都說了非常多的實用案例,大家覺得特別好。但是我們企業該怎麼辦?這些東西好像離我很遠。無界 AI 有一個內容生態中心,它就是來解決這些問題的。剛才說我們如何用 AI 來做鞋的打板、如何來做漢服,這是一個飄在天上的問題。如何讓它成為普通人能使用的,一兩句話就能讓 AI 做好設計,然後進行深度的使用,這是我們無界做的。
無界 AI 內容生態中心在這一年多的時間裏面不斷解決了各行各業的實際問題,在這裏,我都會向大家說明一下。
首先,當我們去年了解到 AI 之後,我們發現 AI 在很多行業都能做非常深入的研究。在第一個項目中,我們做的是偏學術的,在去年 11 月份 AI 初步被大家認可,可以畫很多很精美的圖案的時候,在中國傳媒大學的一個研究老師找到了我們,說我們想要還原一位叫做“薛稷”的唐代老師的畫鶴的圖片。但是他一直以來都在屏風上繪畫,沒有流傳下來。我們都知道宋徽宗的鶴很好看,但是大家不知道唐代薛稷才是畫鶴的祖宗。然後,我們通過了 AI 技術,在各種方面去尋找一些相關的素材,最終我們也通過去西安的一個古墓裏面拓一些鶴的圖片,解決了鶴繪畫羽毛以及口器的難點,最終繪畫成了,得到了大家的認可。
後面,我們發現 AI 對內容生產非常有利,因為有很多國內的內容生產行業,比如說漫畫、動畫是非常有產能限制,國內的動畫人才相對國外來講起步比較晚。對於現在鋪天蓋地的內容需求,很多平台都說我們該怎麼辦,我們沒有辦法投入更多費用進行採購了,所以他們找到了 AI。
我們在今年 2 月份開始,跟國內各大平都有深入的接觸,去做各種 AI 的繪畫嘗試。包括我們這邊看到的純 AI 製作的科幻漫畫,這是它的人設。還有剛剛跟《長相思》做的漫改劇項目,是我們非常成熟的項目,已在優酷平台上播放。這些是我們在內容方面的嘗試。
還有我們在 4 月份做了第一個以畫漫畫為需求的國漫模型。我們的繪畫風格,得到了非常多的小哥哥、小姐姐們的喜歡,他們覺得這個風格是目前市場上別的平台無法滿足的一種需求,非常契合中國人的審美。
6 月份,我們開始深入跟萬事利研究一個新的項目。今天,萬事利的劉總會深入演講,我就不詳細講了,我們做出非常特色的杭州風格的相關模型。
剛才也提到了我們都在往漢服方向尋找解,因為漢服也是我們杭州非常重要的一個特色。我們首次研發了一款漢服模型,在今年 9 月份的時候已經對外公布發布,並且也解決了很多行業的需求。包括我們可以用漢服來製作跟現代服裝結合的漢服樣式,我們也可以通過漢服去直接把《夢華錄》裏面明星穿的衣服進行一鍵學習,讓它成為一鍵同款,但也不會有侵權。像這樣的功能,對於我們漢服模型來講都非常容易,用戶可以輕易上手。
在今年 10 月份,我們也做了相關的影視照相方面的研究。這是我們跟剛剛熱播的電視劇《神隱》合作的,將《神隱》裏面的角色直接替換成我們的用戶,既拓展了作品的宣傳,又可以讓作品在播放階段有更好的變現模式,是一種非常好的 AI 增效方面的嘗試。
這些嘗試,只是我們日常工作的十分之一甚至更少的一部分。我們每周都會遇到各方面的相關需求,包括如何用 AI 設計眼鏡,如何用 AI 設計大理石的紋樣。就像剛才我們說的漢服有面臨打板的問題,大理石紋樣對像素要求是高精度的,需要在一個非常細小的橫截面上進行 AI 繪畫。這樣的工作,對於我們來講每天遇到的都是全新的挑戰,就像是在寫應用題。所以在現場,我給大家手把手演示一遍我們怎麼去滿足我們的用戶需求。
請聽題!我們來玩一個用戶可以把自己的照片畫成一個油畫,或者是畫成一個非常好看的插畫的需求,我們來看一下他們提出的需求。
首先,小韓說我要做一款 AI 的拍照,以後能直接變成水彩畫的工具。要求是一定要像本人,又不能有 PS 感覺或者繪畫的感覺。其次,算力不能太高,如果計算非常複雜,是很難實現的,所以我可能只有 2 台顯卡,只有 8 G,我該怎樣配置,這個工作該怎麼做?將這個問題提到了我們部門。它同時也問如果我要做這樣的事情,我要多久?你說你要給我做一個模型,可能要兩三個月,我等不了,因為我下個月就要用,所以我們天天碰到這樣的問題,這就是我們的提問。
接下來,看我如何解答。小韓給到了我們照片,我要把照片變成一個很好看的油畫,我們來解這個問題。
大家都知道解應用題都有第一步、第二步、第三步。
第一步,審題。我們應該要如何去控制剛才說的人怎麼像他?第一步是我要去想如何控製圖形。在無界 AI 裏面,已選的圖形控制有 Google 捕捉、邊緣檢測、塗鴉上色等。普通人最初階段要想該選擇怎樣的工具?
首先,我們在圖形選擇層面,有非常多的圖形選擇器,包括谷骨骼捕捉、邊緣檢測和線稿提取等。識別完成之後,就得到了一個比較好的模型。
第二步,風格控制。該怎麼畫好這張圖?也就是說我們要有繪畫感,像油畫、像插畫。我們就要選一個風格,如何像油畫、像插畫。
大家都覺得這五個圖都挺好看的,左邊第一個是卡通風,中間是國風水墨,後面又有非常多的真人像,最終像一個簡筆畫。這些都是通過識別的方式“畫”出來的風格,這些風格該怎麼選?賣個關子,這裏所有的都不合格。為什麼?好看,但是不像,跟我的用戶需求不同。我不能交一個用戶直接拍手說好看的東西,我要交付的是一個企業覺得實用,用起來是滿足需求的東西。所以,這五個都不滿足。
所以,我們挑選了幾個相像的,因為這三個就屬於剛才說的風格既符合小韓國這樣位女生覺得需要像,但又有藝術上的風格,左邊偏油畫,中間偏真實寫照,右邊偏插畫,最終我選擇其中一個。
風格已經差不離了,接下來就要做第三步的細節穩定。
對 AI 來講,它識別了臉部線條,進行非常好的風格選取以後,我要考慮的是要跟你多像,這個參數是由我們來調的。調好各種參數以後,我們最終就會出現有筆觸較輕、筆觸較厚、筆觸較圓滑的三種。
現在已經更像了,到底要輕、重還是平滑呢?這個問題,我已經無法解答了,因為我自己的判斷已經結束了,需要交給客戶來判斷。最終,客戶選擇了自己滿意的圖片。
像這個工作,它不是飄在天上,在我們無界都是可以輕鬆完成的。所以現在在座的用戶,都可以用無界去嘗試解決這樣的 AI 需求。
其實到現在為止,工作已經結束了,但我對自己還有個要求,我想要做得更好,因為我覺得這不夠,因為我覺得可能對用戶來講畫一個跟你很像的沒有什麼太好的吸引,這個很簡單。我提出了一個新的點,我說我從原圖做好了客戶的 AI 精修繪畫,我還想做一個創意延展,我想把她畫成妲己的樣子,來吸引更多的用戶,我嘗試了一下。這個其實已經滿足了,我們在整個 AI 的應用題中已經得到了滿足,客戶給了我 10 分,我解完了。
我剛才說我想做一個延展,如果增加一下剛才的風格,我想畫妲己,我想當公主,我想畫惡魔,行不行?我們來做一個更深入的嘗試。
我進行了稍微深度的延展,大家可以看到我分別把剛才的那位女生分別畫成了狐妖、公主、魔女,而且都是像她的,並且她自己非常滿意。所以經過 AI 的深度調整以後,我們還能做更多的嘗試。一整個工作下來,我們就完成了。
剛才為大家完整地演示了我 2 個小時的工作,這就是一個客戶的需求。我們希望在無界的每一個需求,不是飄在天上的,而是一個非常穩定的輸出。用戶所見即所得,我輸入我想要的文字,就能夠生成非常穩定的結果。只有這樣,才能讓 AIGC 最後在實操層面成為一個非常好用的工具,達到細緻、穩定並且精確,這也是我們無界 AI 和無界的內容生態中心一直在想幫用戶解決的問題,我們也會一直研究下去。