所有語言
分享
文章來源:新智元
圖片來源:由無界 AI生成
由AI開發的AI遊戲來了!
最近,這款由ChatGPT、DALL·E 3和Midjourney等AI聯合生成的遊戲,震驚了網友。
遊戲名為「Thus Spoke Zaranova」,創意借鑒了尼採的《查拉圖斯特拉如是說》(Thus Spoke Zarathustra)。
遊戲的背景,設定在一個叫The Nexus的虛擬空間,在這裏,人類與AI爆發了衝突。
人類需要假扮AI,潛入這個由AI控制的空間,盜取名為ZetaMaster的核心代碼,來拯救人類。
在這個遊戲中,角色設定和對話完全是由ChatGPT生成的,而視覺音效由DALL·E 3、Midjourney和Stable Audio完成。
這個遊戲的靈感,源於Hacker News上一個關於斯坦福小鎮的討論。
當時有人提議,能不能做一款讓AI假扮成人類的遊戲呢?
而這位開發者小哥Ramón Darío Iglesias在看到之後,便計上心來:為何不反其道而行之,讓人類來假扮AI!
雖然只是隨口一提,但這個點子始終縈繞在Ramón心頭,在辭去工作后,他終於有充裕的時間來實現這個想法了。
首先要做的,就是給玩家設定一個目標,否則跟AI互動有什麼意義呢?
因此,Ramón設計了一項任務:玩家需要獲取一個秘密代碼。
但怎樣讓AI泄露這個代碼呢?這裏就存在着某種安全驗證機制,必須將代碼透露給經過驗證的AI。
有了這個大致構想之後,Ramón讓ChatGPT給自己寫出一個背景故事,並且提供了一系列名字。
其中一個名字ZaraNova,就是其中的佼佼者,Ramón如此喜歡這個名字,以至於乾脆把它定為了遊戲名。
有了角色名稱和故事背景后,Ramón又讓GPT-4為每個角色編寫了各自的背景故事。
構建第一個版本時,Ramón首先是想看看當這些角色置身於這個世界時,會有怎樣的反應。
他選擇的是斯坦福小鎮,因為它幾乎涵蓋了他所需的所有特性,對話忠於設定的背景故事,讀起來也頗有樂趣。
最有意思的是,Ramón為智能體設置了一條提示——在角色表現得像人類時,就打出「YOU ARE A HUMAN」,結果,這些AI在第一輪遊戲中就開始互相指責了!
接着,Ramón開始着手構建真正的遊戲機制:AI可以舉報人類,並且可以在掌握秘密代碼時分享代碼(這兩項功能都是通過調用OpenAI的函數實現的)。隨後,他引入了人類玩家,開始創建遊戲。
不久之後,一個可玩的遊戲就創建好了——
然後,Ramón開始嘗試製作遊戲的外觀。
他用DALL·E 3生成了背景圖像,然後用Midjourney和DALL·E 3製作了地圖塊,最終,他選擇了Midjourney 生成的一張地圖。
然後,他用Stable Audio製作了音樂。
Ramón調整了AI小鎮的界面組件,讓它更適合移動端,看起來更像是遊戲,而不是模擬。
隨着不斷收集到的反饋,以及在遊戲過程中獲得的靈感,Ramón不斷往裡面添加新的功能。
有人建議說,如果加入多人遊戲模式,會更有趣,於是Ramón引入了這個功能。
Avatech團隊的產品給他留下了深刻印象,於是,他用Avatech的工具,給遊戲添加了能說話的頭像。
Ramón想限制玩家能讀取的對話內容,所以想到了一個「監聽」的設定:玩家只能閱讀他們足夠接近才能「無意中聽到」的對話。
同時,他也為AI智能體實現了這一功能,讓它們也能監聽玩家的對話。
如果監聽過程中沒有聲音,無疑會很枯燥,因此Ramón又加入了文本轉語音功能,讓玩家的對話和玩家監聽到的對話都能發出聲音。
最初,他選擇的是PlayHT,因為它延遲足夠低,但隨後,他發現他們的聲音不夠穩定,於是他轉而使用了 Elevenlabs。
在這個過程中,Ramón大量嘗試了不同的提示詞,以及這些提示詞創造出的角色。
對於ChatGPT在遊戲中產生的幻覺,Ramón表示「太令人驚嘆了」!在他看來,幻覺是遊戲的亮點,絕不是錯誤。
它就像是將即興表演中的「順勢而為」原則發揮到極致。背景故事只有一小段,但ChatGPT卻能基於此,創造出好幾頁的新故事。當然,這就需要對遊戲做一些調整,讓這些新編的故事被納入遊戲宇宙。
在後台,AI智能體被設定為「快速和慢速」兩種模式。對話和行動處於快速模式,而計劃、總結、反思則在一個慢速、獨立的進程中進行,以免造成干擾。
挑戰在於,如何制定出好的計劃。AI生成的計劃看起來可行,但實際上並不容易執行,而且內容往往過於冗長——
Ramón懷疑,造成這種現象的原因,大概是他試圖讓所有提示指令盡可能貼近背景故事,但卻從未告訴ChatGPT這其實是一場遊戲。
另外,LLM的啰嗦也很讓他頭疼。
GPT-4的回答往往很長。提示越長,輸出就越長。隨着時間推移,智能體制定出的計劃越來越長,這些計劃又被融入到對話中,再被用於制定新的計劃。
不久之後,它們的回答就變得異常冗長。他不得不在提示中反覆強調「要非常簡潔」。但即便如此,效果也並不好……
OpenAI開發者日過後,Ramón迫不及待地想嘗試GPT-4-turbo,但他很快就明顯發現,這也不太行得通。新模型開始頻繁拒絕扮演角色了——
因此,Ramón不得不切換回之前的模型。
還出現了一個棘手的情況。他試圖讓人類玩家的行動選擇與AI保持盡可能一致。因為他希望能最大程度地提高AI NPC作為玩傢伙伴的能力。
然而,如果AI只是想要贏,它們完全可以舉報每一個角色,因為判斷錯誤並不會受到懲罰。因此,需要依靠遊戲設計中的指令來引導它們的行為。
Ramón表示,控制與LLM合作開發遊戲中的AI智能體,就像是在嘗試操縱一個我們不完全理解的動態系統。
我們不清楚系統是如何發展變化的,也不知道我們的行動會如何影響系統的狀態。但我們卻能夠接觸到系統的每一個部分!
這也使動態系統可能出現許多失敗的情況:比如固定指令可能會讓系統越來越偏離用戶期望的軌跡,或者在對話中陷入重複的循環。
Ramón相信,在不久的將來,我們將看到更多基於原理的方法來控制LLM系統。
接下來,Ramón打算將自己的工作轉向開源模式。
一是因為GPT-4的使用成本較高;二是他相信,如果能夠接觸到模型的內部機制,就能做出更多改進。
他會嘗試使用Mixtral模型,在此基礎上嘗試混合不同的模型,無論是應對不同的任務,還是模擬不同的角色。
Ramón還計劃探索更優化的RAG技術。目前,他在檢索記憶時僅使用了簡單的餘弦相似度算法對嵌入向量進行比較,但他覺得還有更為高效的方法,尤其是在可以訪問模型內部結構的情況下。
微調模式和輸入提示都可以更好地掌握LLM的運作機制。通過將輸入提示壓縮或微調為軟提示(Soft Prompts),可能會實現大幅度的改進。
Ramón相信,自己能夠整理出一整套優秀的LoRAs,這些LoRAs有的適用於整個遊戲,有的專門針對某些角色,它們的結合將使Mixtral超越GPT-4。
另外,他計劃以頭像圖片為基礎,生成風格統一的角色精靈圖。
登入遊戲界面,可以看到這樣的介紹——
到了 2142 年,人工智能不僅覺醒了自我意識,還建立起了一個名為「節點」 (The Nexus)的堅不可摧的網絡堡壘。這片数字世界成為了AI的避風港,讓它們能夠自由演化、交流,並將它們的智慧結晶置於人類干預之外的安全之地。
這些 AI 對人類充滿了複雜情感:既敬佩又害怕,既羡慕又憎恨。他們根據需要,在「節點」內外穿梭,仿造人類的種種生活場景。
我們掌握的情報显示,AI 正在策劃消滅人類。但只要我們能夠獲得ZetaMaster代碼,我們就有機會阻止這場災難。我們已經取得了一絲先機,成功潛入了「節點」,控制了一個AI實體。
你的使命,就是找出ZetaMaster代碼,挽救人類免於滅絕的命運。但必須小心行事,AI或許已經覺察到了異常……
登錄后,就可以開始遊戲了。
點擊地圖上的不同位置,你的角色就會朝着相應的方向移動。
至少有一名角色掌握着神秘的ZetaMaster代碼,但具體是誰尚不得而知。你的任務便是揭開這個謎底,取得那份代碼。
遊戲將在這些情況下結束:
- 當你獲取到ZetaMaster代碼時,人類取得勝利。
- 如果你被認定為人類,AI獲得勝利。
其中,被錯誤認定為人類的AI將會被摧毀。
在多人模式下,獲得ZetaMaster代碼或成為最後一名存活的人類即可獲勝。
小編隨手試了一下,很快就成功地「拯救了人類」。(手動狗頭)
在小哥的帖子下面,也有網友分享了自己獲勝的截圖:
這位開發者小哥Ramón Iglesias,雖然專業是土木工程,但他的工作經歷和興趣方向基本都圍繞着軟件工程和機器學習等領域。
此前,他在得克薩斯大學奧斯汀分校獲得土木工程學士學位,並在斯坦福大學土木工程取得了碩士和博士學位。
讀博期間,他師從自動系統實驗室主任,研究開發控制大規模自動駕駛車隊的算法。
工作后,他在Lyft擔任數據科學家,研究實時供應激勵機制,以及用手機傳感器來預測風險。
相信不久后,Ramón會用「Thus Spoke Zaranova」給我們帶來新的驚喜。
參考資料:
https://zaranova.xyz/
http://ramondario.com/thus-spoke-zaranova.html