所有語言
分享
原文來源:機器之能
圖片來源:由無界 AI生成
文生 3D 模型又來新玩家。
隨着生成式 AI 的浪潮席捲而來,科技公司都在衝擊 AIGC 的下一個突破口 —— 3D 生成。
目前,文生 3D 在學術界取得了許多新突破。在產業界,無論是像英偉達這樣的行業巨頭,還是像 Stability AI 這樣的中堅力量,都推出了自己的文生 3D 工具。雖然 3D 生成領域一直「卷」到飛起,但是好像一直沒有出現一款效果足夠驚艷,生成速度足夠快的代表性產品。
如今,一直致力於 3D 內容生產的 Luma AI 向這一領域發起了挑戰。就在昨天,Luma AI 發布了一個文生 3D 模型的項目 —— Genie 1.0。只需要輸入一句文字提示,Genie 1.0 就能在 10 秒內生成四個高保真的 3D 模型。用戶可以從中選擇,並在三維網格界面內對模型的紋理進行編輯。
這些 AI 生成的 3D 模型可以在屏幕上預覽,也可以導出到 Blender、 Unity 等工具中進一步使用,直接加入動畫、遊戲、VR 等工作流中。
Genie 1.0 不僅有網頁版,在 discord 平台和手機端都可以試玩。一經發布,慕名而來的網友們就把 Genie 1.0 衝上了 App Store 下載榜前列。
試用地址:https://lumalabs.ai/genie?view=create
效果有多驚艷,一起來看看。
簡單輸入提示「flower cat」,再等待幾秒,四隻身上帶有不同花紋圖案的貓咪就出現了。想要什麼手辦,AI 直接送上精美的盲盒版本,一次輸入,能抽四次,怎麼算都很賺。
泡泡瑪特風格這麼可愛的手辦,也能安排。想要什麼隱藏款,AI 版本實現量產。
文生 3D 中的難題,毛髮和物體表面的花紋,Genie 1.0 也有令人驚艷的表現。它生成的熊貓能看得到毛茸茸的質感,衣服上的紋樣也沒有出現明顯的失真。
推特 @lintworld
如果《星球大戰》出 3D 動畫版本,直接使用這隻 Genie 1.0 生成的「尤達大師」好像也沒什麼問題。
推特 @blizaine
和其他 3D 模型對比,Luma AI 的表現在立體度和真實感方面,也能拔得頭籌。
推特 @taziku_co
除了生成效果驚艷,Genie 1.0 還有編輯功能。拆掉了原來的專業門檻,告別貼素材,修改 3D 模型的材質可以像用手機 P 圖一樣簡單。
Genie 1.0 提供了「原始」、「光滑」和「反光」三種質感,點擊頁面右側的圓形按鈕即可切換。還可以按照需要導出不同清晰度和格式的模型,與其他 3D 編輯軟件無縫對接。
以往,批量設計 3D 模型往往需要花費數天,雖然目前市面上已經有很多 AIGC 工具把 3D 設計的時間縮短到只需幾小時甚至更短。但 Genie 1.0 已經把人們加工的時間壓縮到了 2 分鐘。
已經有 3D 設計師表示把 Genie 1.0 生成的模型導入 3D 動畫軟件 Maya,因為 AI 生成的模型質量很高,紋理坐標(UVs)很合適,只有幾個小塊有重疊,花 2 分鐘小調一下,就直接可用,體驗一流。
在動畫軟件中加上幾個動作錨點,3D 動畫就這麼製作好了。
推特 @taziku_co
在此基礎上稍加編輯,靜態的模型模型瞬間大秀机械舞,帶來十幾秒的連貫表演。
推特 @paradoxrenders
轉化成遊戲動畫,也進化成了速通版本,只需要打字就能生成遊戲角色動畫可能也不再是夢。
其中的模型基礎由 Genie 生成,源自 YouTube@OlliHuttunen78
雖然 Genie 1.0 還未完全克服 AI 生成的 3D 模型往往比較模糊這個問題的「最後一公里」。但在引入 Magnific ai 來提升分辨率之後,卡車輪胎上的花紋、排氣管的褶皺,連接零件的電線都被勾勒出了清晰的細節,和真實世界中的卡車擺件沒什麼分別。
推特 @MartinNebelong
Genie 1.0 能做到的正好直擊了 3D 設計的痛點,傳統的 3D 建模過程通常較為繁瑣,往往需要大量專業人員的手工操作,這不僅導致製作周期延長,同時也增加了整體成本。進入動畫、遊戲、VR 等進一步設計流程后,建模還需進一步調整和修改,設計成本又將成倍上升。
也許正如 Luma AI 創始人 Amit Jain 所說:「藉助 Genie,運用 AI 大規模製作 3D 物品或許將不再只是幻想。」
在 Genie 的加持下,即使不會 3D 建模和繪畫設計,但有一個涉及 3D 圖形或 3D 場景的想法,你都可以讓它像精靈一樣實現你任何的想法。
目前,Genie 既有免費版,也有付費 API。付費界面每次需要花費 1 美元。該公司指出,這比依靠人類設計師更便宜、更快捷。
Luma AI 公司介紹
推出 Genie1.0 的 Luma AI 是一家生成式人工智能初創公司,該公司一直致力於 3D 內容方案,主要產品和功能包括圖片轉 3D、視頻轉 3D、文本轉 3D 等。
這家公司成立於 2021 年,首席執行官 Amit Jain 曾是蘋果公司的計算機視覺系統工程師,首席技術官 Alex Yu 曾是加州大學伯克利分校的研究生(放棄博士學業創辦了 Luma AI )。二人在 3D 視覺、機器學習、實時圖形學等領域都有所建樹。
這家公司已經經歷了數輪融資,其中在由 Amplify Partners、Nventures(Nvidia 投資部門)和 General Catalyst 領投的 A 輪融資中籌集了 2000 萬美元,在由硅谷頂級風投公司 Andreessen Horowitz、英偉達領投的 B 輪融資中籌集了 4300 萬美元。截至目前,公司共融資 7000 多萬美元,估值在 2 億到 3 億美元之間。
就其產品而言,不同於文本轉圖像模型所產出的数字藝術平面位圖,Luma AI 利用 AI 從照片、視頻或文字描述中創建物體的 3D 模型,這些模型可以根據需要被下載、操作、編輯和渲染。
去年 11 月,Luma AI 在 Discord 服務器上推出了文生 3D 模型 Genie。這次的 1.0 版本,把出圖時間從 20 多秒提升到了 10 秒之內。
Luma AI 的核心技術是神經輻射場(NeRF)算法。Luma AI 基於 NeRF 做了很多改進和優化。在場景圖像獲取、數據預處理、模型訓練、模型渲染及其他模型文件的生成等方面,Luma AI 均做了很多優化工作。在此基礎上,技術更高超的人類藝術家可以高效地製作更好的模型。此外,Genie 的輸出或許也能滿足一些人的特定生產需求。
同日,Luma AI 還官宣了三位新成員,其中首席科學家宋佳銘(Jiaming Song)將領導基礎模型研究團隊。他本科畢業於清華大學,碩博畢業於斯坦福大學。在加入 Luma AI 之前,他曾擔任英偉達學習和感知(Learning and Perception)研究團隊和深度想象(Deep Imagination)研究團隊的研究科學家。
另外,加州大學伯克利分校博士 Matthew Tancik 將領導應用研究團隊,來自蘋果設計工作室的 Tuhin Kumar 領導界面、交互和產品設計團隊。
參考鏈接:
https://techcrunch.com/2024/01/09/luma-raises-43m-to-build-ai-that-crafts-3d-models/
https://twitter.com/LumaLabsAI/status/1744778363330535860
https://www.theregister.com/2024/01/10/textto3d_image_startup_luma/