所有語言
分享
文章來源:頭部科技
文丨海天
微軟似乎對開發新AI模型極為痴迷,接二連三發布新作品。 2023年6月微軟發布Phi-1,12月又更新至Phi-2,到了今年4月,它又發布擁有38億參數的Phi-3。
按照微軟的介紹,Phi-3追求“小而美”,可以在智能手機、筆記本電腦上運行。
最近又有消息稱微軟正在開發MAI-1模型,它與Phi-3完全背道而馳,擁有5000億參數,是微軟至今為止最大的模型。
雖然我們現在還不知道MAI-1有什麼賣點,也不知道微軟想通過它達成怎樣的目標,但有一點是可以肯定的:微軟希望憑藉MAI-1鞏固AI霸主地位。
微軟MAI-1還沒有正式發布,目前仍處在開發階段,所以很多細節我們無從知曉。考慮到MAI-1是超大模型,它瞄準的對手無疑是谷歌、OpenAI。雖然微軟是OpenAI的早期投資者,但二者也存在競爭關係。
對於微軟來說,訓練MAI-1有優勢,因為它擁有海量數據。為什麼微軟要從零開始開發全新模型MAI-1呢?可能微軟不想將全部賭注押在OpenAI身上,也可能是想擺脫垄斷嫌疑,讓美國監管機構放心。
MAI-1擁有5000億參數,比很多其它大模型都要龐大,例如,Meta開發的Llama 2模型只有700億參數。儘管MAI-1是微軟至今為止最大的模型,但還是比不過OpenAI GPT-4,後者據說有1萬億參數。
微軟擁有龐大的數據資源和算力,它還採購大量英偉達GPU,組建服務器集群,完全有實力訓練規模龐大的模型。未來微軟肯定會繼續加大算力投入,訓練更大的模型。
2019年微軟首席技術官Kevin Scott曾在郵件中告誡員工,相比谷歌和OpenAI,微軟在AI領域進步緩慢。暗中開發MAI-1意味着微軟想挑戰行業領導者,降低對OpenAI的依賴,實現AI產品多樣化,未來微軟與谷歌、OpenAI的競爭將會升級。
幫助微軟開發MAI-1的大佬叫Mustafa Suleyman,他曾是AI創業公司Inflection的CEO。不久前微軟斥資6.5億美元收購Inflection,Mustafa Suleyman順理成章成為微軟員工。
雖然MAI-1是Mustafa Suleyman領導開發的,但它並沒有採用Inflection模型,而是微軟重新打造的。微軟有可能借用了Inflection的數據和技術,但並沒有將Inflection模型拿過來直接更換皮膚然後使用。
Mustafa Suleyman在創建Inflection之前曾在谷歌AI部門工作,所以他在美國AI領域名聲遠揚。在谷歌工作時,Mustafa Suleyman創建了谷歌DeepMind AI實驗室,實際上他為微軟工作才一個月,我們有理由相信微軟團隊才是MAI-1的真正“作者”,只是現在工作交到Mustafa Suleyman手中,由他接管。
5月7日Mustafa Suleyman在推特上發消息稱微軟從上到下擁有強大文化,這在如此規模龐大的企業中實屬罕見。他還強調微軟是一家“真正的AI優先企業”,推動着技術實現大變革。
3月份Mustafa Suleyman加盟微軟時微軟CEO Satya Nadella曾野心勃勃表示,要以安全、負責任態度讓AI服務於地球上的每一個人和每一個組織。言語之中不難看出Satya Nadella對Mustafa Suleyman有着超高期待。
Mustafa Suleyman對AI有着自己的獨家見解,他認為AI本質上就是“勞力替代工具”,他極為看重責任感,要求AI開發向社會負責,這一主張與Satya Nadella的理念是吻合的。
微軟目前正在重點打造Copilot,Mustafa Suleyman認為它是真正具有變革性的AI工具,前途不可限量,希望能為Copilot進化貢獻自己的智慧。
正如之前所說的,MAI-1的參數為5000億,而GPT-4達到萬億,明顯GPT-4有優勢。不論是原始處理能力還是應對複雜任務的能力,MAI-1都比不過GPT-4。
2020年年中時OpenAI推出GPT-3,它擁有1750億參數;到了GPT-4,參數膨脹至1萬億。1萬億隻是外界猜測的數據,OpenAI並沒有確認。有人甚至認為OpenAI旗艦LLM擁有1.76萬億參數,谷歌Gemini Ultra擁有1.6萬億參數。Gemini Ultra對標的也是GPT-4。
如果單看參數,MAI-1遠不及GPT-4和Gemini Ultra,考慮到微軟擁有龐大的數據資源和超強計算基礎設施,差距應該能縮小一些,但不太可能超越GPT-4。
在比較時我們也不能光看參數,還要關注大模型的功能和性能。兩款大模型都能執行多種任務,比如自然語言處理、代碼生成。無論是用學術指標還是職業標準衡量,GPT-4都很出色,已經得到認可,MAI-1還沒有正式發布,也沒有接受評測,所以它的性能如何我們還無法給出結論。
唯一的線索來自Mustafa Suleyman,他暗示MAI-1非常強大,至於是不是誇大,誇大了多少,還要讓時間來回答。不用等很久,有消息稱MAI-1最快可能本月就會發布。
MAI-1和GPT-4並不是毫無關係的兩個產品,二者也有一定聯繫。例如,微軟訓練MAI-1時借用了GPT-4生成的文本。
5月16日微軟將會召開Build開發者大會,業界普遍認為如果性能達到預期,微軟會在大會上發布MAI-1。如果真是這樣,微軟可能已經擁有原型MAI-1產品,如果沒有,那麼未來幾周必然準備好原型。