所有語言
分享
剛剛過去的2023年裡,GPT大模型開啟了普通人走向AI世界的“魔盒”,也拉開了全球各國科技公司的大模型“軍備賽”。
文本、圖片、視頻大模型紛紛湧現后,應用端狂卷創新,也造成AI芯片資源緊缺,“AI替代論”、 “風險質疑”無時無刻不在上演。AI的一面是人類對先進生產力的狂熱追求,另一面是人類面對新技術的擔憂。
站在2024年回望,AI還遠遠沒有到取代人類的階段,技術瓶頸也顯露出來:芯片技術限制了人工智能(AI)通往通用人工智能(AGI)的速度;用於訓練大模型的數據們被視作“珍惜材”,掌握在互聯網公司的手裡;而商業化后的AI應用還沒有普惠每個人,國內的不好用,海外的不便宜。
假如將它放在更長的時間維度看,當前的AI大模型最多算是人類剛剛發現火源。如何用、用在哪將是2024年AI向前的方向。我們還看到,OpenAI、谷歌等AI科技公司們開始研發芯片了,“盜火者”們正在將火力開大。
2023年,AI領域出現了許多歷史首次,很多都是ChatGPT帶來的。
ChatGPT讓普通人第一次見識了計算機對自然語言的理解,人工智能不再是電影中神奇的“秘密武器”;非人類的ChatGPT首次上榜“2023 年度十大科學人物”。
從2022年11月發布到現在,OpenAI發明的ChatGPT所引起的關注和產生的影響,已經超越了信息技術歷史上幾乎所有熱點:用戶數2天達到100萬,2個月達到1億,打破TikTok之前的紀錄。半年後,ChatGPT iOS App一經發布快速登頂蘋果應用商店總排行榜。
對於ChatGPT來說,更具時代意義的是,它成功打破了科技巨頭對AI技術的垄斷,將能理解人類語言的產品帶到了每一個普通人面前。
ChatGPT是許多人平生第一次接觸到如此高智能的對話系統,會寫文案,會算數學,上知天文,下知地理,能讀懂故事,也看得懂網絡熱梗。儘管起初會“一本正經的胡說八道”,產生幻覺,但它會在人類的提示中修正。
ChatGPT背後的通用大語言模型的更迭速度也十分驚人,僅僅一年,就從GPT3.5版本升級到了GPT 4 Turbo版本。而在一個多月前,也就是2023年11 月初,OpenAI 在開發日上正式宣布了 GPTs 計劃,ChatGPT Plus 用戶可以在 GPT-4 的基礎上,利用自己擁有或找到的數據訓練出一個專屬的ChatGPT對話機器人。
OpenAI再次讓人驚掉了下巴,而GPT-5 的商標申請已經在冊。根據美國專利商標局展示的信息,GPT-5提供的功能包括自然語言處理、文本生成、理解、語音轉錄、翻譯、預測和分析等。
OpenAI提交了 GPT-5 的商標申請
在 OpenAI 官方的藍圖中,他們之後還會上線 GPTs 商店,支持用戶上架自己訓練的機器人並提供給其他用戶付費使用,由此建立一個新的商業形態。短短不到兩個月的時間,用戶通過自定義GPTs構建的特定領域ChatGPT助手已超過數十萬個,其歡迎程度可見一斑。
2024年,OpenAI若開放 “GPT商店”,又一波應用熱潮將席捲互聯網。
OpenAI成功如同哥倫布發現新大陸一樣,他告訴了所有人:這條路走得通。也就在這短短的一年時間內,ChatGPT 直接刺激了全球科技公司之間的人工智能軍備競賽。
數據显示,截至今年10月,在不到一年時間,中國擁有10億參數規模以上大模型的廠商及高校院所就超過了250家,這裏還不包含國外大模型的數量。AI應用更是噴涌而出,Sensor Tower報告显示,僅在2023年上半年,AI應用下載量同比增長114%,突破3億次,超出2022年全年水平。與此同時,AI應用內購收入同比激增175%,逼近4億美元。
激烈的競賽中,成千上萬個大模型進化出了文生圖、圖生圖、文生視頻、圖生視頻等強大的多模態能力。人們剛剛還驚訝於ChatGPT的能說會道,眨眼間,Bard、Clude等識網梗的模型就出現了。
此外,一些垂直領域也殺出了“獨角獸”。
在圖片生成上,Midjourney一馬當先,成為最強的文生圖工具。從出生到現在,短短半年,Midjourney已經更迭至V6版本,從最初的文生圖向圖生圖、AI擴圖多能力發展。
Midjourney細緻到毛孔的生圖能力
更令人驚嘆的是,在Midjourney背後,是僅成立2年的11人的團隊。隨着Midjourney的躥紅,團隊已經擴展至40人,僅在今年就實現了2億美元的營收,早早就實現了經濟獨立。
與大多數追求風投的初創公司不同的是,Midjourney沒有拿VC一分錢,“客氣一點的說法是,他不需要VC進入他的生活。”微軟旗下風投基金M12的合伙人Michael Stewart表示。
AI應用發展速度之快可用 “日更”形容。
Midjourney走紅后不久, Runway公司的Gen-2在視頻領域接棒,與其初代產品Gen-1相差僅僅1個月。最新版本的Gen-2不僅可以僅根據一句提示詞就可以生成18秒的視頻,且能熟練運用電影鏡頭語言。就在最近,Gen-2新增了圖生視頻的功能,只需“塗抹”圖片中的某個區域,就可以讓它動起來。
AI卷向視頻賽道,Pika1.0、Stable Video Diffusion等後起之秀奮起直追,各類AI視頻工具“鬥法”,進化速度越來越快。其中,剛剛推出沒多久的Pika1.0的文生視頻能力已經可以和Gen-2相媲美,甚至首次將AI擴圖能力帶到了視頻界。
2024年,大模型的多模態潛力還將被這些獨角獸繼續發掘,甚至產生新的獨角獸。文本、圖片、音頻、視頻這些代表人類自然語言的產物仍會被AI工具精耕細作,而工具將很可能在規模化下變得更加趁手和便宜。
科技大公司卷大模型,小公司卷應用,競爭之外,“賣水者”英偉達賺得盆滿缽滿。數據显示,英偉達最新第三財季營收達181億美元,同比增長206%;凈利潤92億美元,同比增長高達1259%。而引發這場競賽的“領頭羊”OpenAI的2023年營收僅達到13億美元。在去年,OpenAI的營收也才2800萬美元。
2023年,英偉達無疑坐穩了AI的風口,芯片價格一路水漲船高,即便價格高漲,芯片仍是“一卡難求”,有消息稱,英偉達H100的交付周期長達36周至52周不等,如此長的交付周期明顯無法滿足AI產品發展的需求。這也可能是GPT-5長時間未到來的原因。
算力作為驅動AI發展的三駕馬車之一,芯片的短缺直接影響了大模型的進化速度,OpenAI、谷歌下場自研芯片,以補充自家大模型訓練的缺口。
英偉達的競爭者們也搶着分“蛋糕”,英特爾和AMD分別推出Gaudi3和Instinct MI300X高性能AI芯片,微軟公布 AI 加速芯片Azure Maia 100,亞馬遜則發布了面向AI系統的升級款加速器芯片Trainium2。
與此同時,美國的芯片制裁進一步加劇了中國芯片短缺的危機。為保市場,英偉達只能推出一些性能縮水的“閹割版”芯片。
為了不再讓硬件上被“卡脖子”,華為著力研發AI芯片,昇騰AI芯片成為了國內支撐,應用方科大訊飛表示,華為昇騰910B已經基本做到可對標英偉達A100。
行至2023年末,無論國內還是海外,仍未出現一款可以媲美英偉達H100的芯片,儘管芯片廠商已經開足馬力,但短期內,芯片資源緊缺的情況仍會持續。或許只有等到AI芯片資源問題被解決,GPT-5以及更加先進、豐富的產品才能更快到來。
但從安全角度來看,這也並非完全是壞事。在這短暫的喘息之際,人類可以為人工智能的發展方向做一個更佳的選擇。
要知道,GPT-4剛剛發布時,一封上千名科技精英的聯名信將AI安全問題推至聚光燈下,他們聯名請求“暫停訓練比GPT-4更強大的AI系統”,用AI領域的專家Gary Marcus的話說:“用百分之一的人類毀滅風險換取和機器對話的樂趣,這值得嗎?”
的確,ChatGPT剛剛推出時,其顛覆性的創造力確實讓人震撼,微軟的創始人比爾·蓋茨也強調過AI失控的可能性是存在的。
今年初,網絡還充滿着“AI搶飯碗”“AI取代人類”的擔憂,甚至出現了“碳奸”的梗。但一年過去了,現在大家對去AI的態度已經回歸理智。
我們還沒有真的看到“打工人”因為AI而大規模失業,至少在國內,AI被普遍運用到工作中仍是未來進行時。與此同時,OpenAI等代表性企業的AI安全措施也不得不跟上,各個國家的AI安全審查機構相繼成立。
AI的前進是必然的,“火”到底怎麼用還在於人類的選擇,一席人在製造控制火苗的爐子,另一些人着力火苗還能點亮哪些荒漠。
2024年,安全仍將是AI發展的主題之一,芯片則是生產力能否進一步提升的關鍵,唯一可以確定的是,AI將如同互聯網一樣,將成為未來必不可少的人類工具。