所有語言
分享
文章來源:AI鯨選社
作為鮮有的AIGC上市且盈利的公司,美圖的AIGC發展之路非常值得關注。
上圖是美圖的核心產品矩陣,底座是美圖自研的大模型MiracleVision(奇想智能)。攤子鋪的非常大,布局幾乎涵蓋了主流的AIGC賽道,但也面臨着每個賽代的實力玩家競爭。
比如美圖在圖片設計賽道與國外AI知名公司Canva狹路相逢,在文生圖片領域面臨Midjoueney等重磅產品的競爭;AI口播開拍和國內的閃剪、heygen等名玩同賽道競速;文生視頻whee面臨國外的Sora,國內字節的Dreamina等大咖夾擊。
儘管在2023年該公司的業績略有改善,但相比2019年的市值巔峰,很多人擔心美圖市值跌破100億。如今,美圖秀秀將希望寄托在大型AI模型上,能全面出擊,全面勝利嗎?
AI生圖功能在美圖秀秀APP中就能體會到,充會員后每天有六十次圖片生成機會。
鯨哥從不同風格都測試了美圖繪畫的AI生成能力,首先測試的是動漫風格。
prompt:水中捧着愛心的小女孩,夢幻的色彩,傑作,高質量,動漫風
首圖為美圖生成,第二張為Midjouney生成。兩相比較,MJ更“夢幻”,美圖的更卡通,有點兒童化。
再測試一下遊戲特效風:
prompt:賽博朋克,霓虹都市,機器人,無人駕駛,遊戲概念設計,高分辨率,傑作
談到“cyberpunk”,這方面的圖片素材肯定不會少。看出圖效果,整體審美和畫面細節上,美圖都略顯動漫,且美圖生成的幾張待選圖片,都有一個明確的人物或機器人作為畫面主體,佔據了視覺中心。MJ則不同,生成的圖片更有城市的破敗感,視覺角度更多樣,想象空間也更豐富。
還需注意的是,諸如“末日”、“戰爭”、“死亡”、“焦土”等略帶負面意味的浪漫意象,均無法通過美圖的審核機制,一定程度上給圖片的生成可能性打了折扣。
來看看3D效果:
prompt:戴着超大耳機的可愛女孩,3D渲染,超高分辨率,豐富的細節
輸入這條prompt的原意是測試美圖的3D效果能力,卻不經意間測出了美圖在人像生成上的優勢。從上面兩幅圖來看,雖然MJ在審美上更勝一籌,可美圖秀秀的3D肖像效果卻是無可挑剔。可能因為其本身作為中國最大的照片修圖工具之一,美圖秀秀擁有大量的人像圖片素材來訓練。
帶着這個猜測,我們繼續測試一下MJ和美圖的人像效果。
prompt:一位寫實的青年真人男律師肖像,戴眼鏡,半身照,身着西裝,淺灰色背景,豐富的畫面細節
果然,這一輪比拼中,美圖生成的肖像更寫實,細節更豐富。而MJ生成的肖像就近似油畫風格了,鯨哥調了幾遍生成的圖片寫實效果仍然不夠。
那是不是美圖的寫實效果就比MJ好呢?
prompt:金毛獵犬在水下追逐網球的照片,特寫肖像,專業攝影,驚人分辨率
不盡然。從圖片效果看,MJ的圖片分辨率高得嚇人,生成的金毛和水中姿態都好看。美圖生成的金毛雖然寫實,卻有點失真了,毛髮的細節不太正常,而且出現了很多個網球,沒有體現出“追逐“這一動作。看來,美圖是在人像寫實效果上做的更好,普通的寫實效果圖不一定能比過midjourney。
最後,測一測中國風風格:
prompt:孤舟蓑笠翁,獨釣寒江雪,中國風,水墨畫風格,傑作
從出圖效果看,MJ是真的理解了“中國風”和“水墨畫”,美圖雖然做的也不錯,畫出了遠中近風景,就是隱藏了些卡通風。
在文生視頻上,美圖也下了功夫,推出了文生視頻產品Whee。文生視頻毫無疑問是最難啃的賽道,因為生成的視頻內容為三維現實,就連OpenAI的Sora都沒辦法完全理解現實的邏輯。
我們首先拿Sora出圈的東京女子街頭漫步的prompt測試一下Whee的文生視頻效果如何:
prompt:一位時尚女性走在東京的街道上,街道上到處都是暖色調的霓虹燈和動畫城市標誌。她身穿黑色皮夾克、紅色長裙和黑色靴子,手拿黑色皮包。她戴着太陽鏡,塗著紅色唇膏。她走起路來自信而隨意。街道潮濕而反光,與五顏六色的燈光形成鏡面效果。許多行人走來走去。
從生成的視頻來看,Sora做得最好,但是沒公測;字節的Dreamina生成了相應的視頻,景色和人物都比較逼真,鏡頭感也有一定的呈現,特別的是時尚女性有點胖。
Whee的文義理解做的不錯,“黑色皮夾克、紅色長裙、黑色靴子”這麼細緻的服裝都能識別得出來,”暖色調的霓虹和動畫城市標誌“也算過得去(橙色是暖色調)。
但是,視頻中的女子和路人幾乎沒有移動,女子雖然移動了,但並不協調。整體來看,更像生成了一張圖片,然後讓圖片變形了一下。
在應用界面里,Whee提供了很多種不同的視頻風格,如鎏金珠寶、3D卡通、外景商拍、特效人像、自然紀錄片等。在國內,能針對性提供不同的AI視頻風格的,Whee可能還是頭一個。像鎏金珠寶、外景商拍、特效人像這些風格,都可以直接商用,我們當然要測試一下。
讓我們試試“鎏金珠寶”風格:
prompt:人像攝影、1女子、手上的紫色戒指、純色背景、4K分辨率、時尚風格、簡潔大氣、柔和自然光、光滑亮麗
得誇一下美圖秀秀的文義理解能力,”女子、紫色戒指、純色背景“都能準確生成,但對於最大的生成難題——手,美圖也沒能解決,認真看會發現只有四根手指。而且視頻的生成時間很短,只有1s,近似於一張圖片。
另外還得誇一下Whee在文生視頻時的“智能聯想”功能,只需要輸入幾個關鍵詞,就可以自動幫你補全prompt,上面的prompt就是由智能聯想而成。
再試試“外景商拍”風格:
prompt:高級廣告、香水噴洒、至尊香水瓶、華麗宴會、4K超清、奢華風格、金碧輝煌、聚光燈照射、玻璃光滑
“外景商拍”風格做的很好,看起來跟廣告沒有區別了,還能做到視角的旋轉,難度不小。估計以後這種商業性質的AI視頻生成產品會越來越多,因為需求大,難度較生成電影級別的鏡頭也低很多。
最近很火的AI視頻動漫化,美圖秀秀也沒有錯過。鯨哥之前做過一次Goenhance的測評,這次加上美圖wink和國產新銳啵啵動漫,一起做個橫評。
啵啵動漫整體還原度、手勢表情各方面都表現不錯,美圖這個付費版生成的效果有些驚喜,就是轉動漫的人像比本人還美,不得不說美圖在人像方面的實力。但細節確實有問題,比如這個視頻經典的比方框手勢显示不出來,以及視頻中偶爾一隻胳膊沒了。
目前看,Goenchace能提供多種多種動漫風格,而美圖秀秀能提供多種“變身”效果:
上面使用的是變身效果”煙花“,可以看到視頻主體一開始為真人霉霉,摘墨鏡的瞬間釋放煙花,隨後視頻就動漫化了,賞心悅目。
目前,AI公司都困於盈利,頂尖的paper發了一堆,商業化卻都做的不好。就算是ChatGPT,目前也沒摸索到好的商業化方式,只能通過增值服務和API接口的方式賺錢。
在那麼多的AI商業化嘗試中,数字人直播帶貨被證明是最賺錢的。所以在這一塊,美圖也沒閑着,推出了其AI口播視頻工具“開拍”。據悉,”開拍“月活躍用戶數已突破35萬。
地址:https://www.kaipai.com/home
操作上,只需輸入人像照片和口播內容,就能讓人像開口說話。鯨哥將咱們公眾號“鯨選pro“的文章《阿里為什麼投了那麼多大模型?》中的片段輸入進去,看看效果如何:
視頻中的口播內容如下,感興趣的朋友可以點擊原文章鏈接閱讀:
大模型公司雖然都是獨角獸級別(10億美元估值)。看起來很貴,但對於阿里來說,依然很便宜,尤其在當下阿里PE僅有15,市值被嚴重低估之際。 這也許是更懂財務的阿里董事長蔡崇信的安排。我們從上圖中兩條折線的差值,看到代表資本性支出規模這一數值的變化,阿里是想繼2017年後再度開啟投資盛事世,當時投資新零售等,現在投資大模型,為集團投出來一個未來。就像雅虎投資阿里巴巴,最後阿里巴巴的股權價值已經超過了沒落的雅虎本身。所以,阿里會成為下一個萬億市值的微軟,還是投資火主業虛弱的雅虎?
嘴型是衡量AI数字人能力的最核心指標。雖然視頻中的女生的確”開口說話“了,但嘴型與輸入的視頻內容並不一致,較顯生硬。数字人是最卷的賽道,這個水平屬於不入流。
美圖秀秀的另一款数字人生成工具Dream Avatar,目前在APP Store就可以下載,主打”数字明星“、”数字替身“,其實就是可以讓視頻里的真人變為虛擬人,同時保持其動作不變。
操作不複雜,只需要輸入視頻,選擇有人物的關鍵幀,再選擇替換的数字替身就可以了。
鯨哥輸入了一條2s的霉霉視頻:
效果如下:
替換得還算可以,但是需要注意,輸入的視頻最好只有一個鏡頭。鯨哥嘗試將上文動漫化之前的霉霉視頻輸入,因為有遠、中、近景的變化,AI沒辦法很好地識別出是同一個人,在替換時也只將其中一個鏡頭的霉霉進行了替換,還影響到了其他的鏡頭,堪稱大型翻車現場。。。
Dream Avatar想走的應該是柳夜熙、厘里那樣的虛擬偶像路線,致力於讓每個人都能在未來的元宇宙里擁有一個屬於自己的数字形象。但當下談實現元宇宙還言之過早,連AI的普及都還需時日,元宇宙就更得等到更久之後了。在當下,比起数字人直播帶貨,Dream Avatar商業化要難的多啊。
作為國內頭部的AI修圖工具,美圖秀秀肯定不會放過設計賽道。
美圖秀秀專門推出了”美圖設計室“,移動端和網頁端同步上線,其中有AI模特、AI logo、AI商品圖、AI海報、AI寫真等多種功能。
鯨哥首先嘗試了一下AI海報,輸入Logo、活動主題、活動時間、活動地點、邀請函內容、二維碼之後就可以自動生成。下面是效果圖:
對於海報,網絡上擁有的模板和素材實在太多,生成效果好倒也不驚訝。但對於普羅大眾來說,這依然是個很實用的功能。
美圖為用戶提供了不同的AI模特,並配備不同的場景,用戶上傳真人照片即可使用AI模特功能:
上傳服裝圖,選擇模特+造型,就可以生成效果圖:
至於AI商品則更簡單,鯨哥上傳了自己的一雙德比鞋,選擇了一個模板,一幅商品圖就出來了:
美圖還手把手教你寫prompt,提示用戶一個完整的prompt公式應該為“產品主體+場景+元素/光影+風格/分為/畫質”,如上圖的prompt就是“放在大理石上,被花草植物環繞,白色鮮花,淺色配色,高級感”。
這個功能非常有用,以後淘寶小商家在上傳自己店鋪的商品圖時,就能省去繁瑣的拍攝步驟,直接用AI了。
無論是新興行業,還是既定行業中出現的新機會,進入時機都是很關鍵的。
美圖殺進生產力工具賽道氣勢雖足,但AI還是新手。美圖AI生態中的智能修圖、AI商拍、数字人、文生視頻、文生圖等產品,單獨拎出來都是一個獨立的賽道,每個賽道上都充斥着大廠和創業公司,能否勝出還是未知數。
站在AI的肩膀上,美圖能否更具有競爭力,還需市場說了算。