所有語言
分享
原文來源:光錐智能
作者:劉雨琦
圖片來源:由無界AI生成
大風始於青萍之末,命運的偶然和必然經常會縱橫交織在一起。
2019年,是整個人工智能歷史上,最為晦暗的一年。繼2016年AlphaGo打敗李世石,2017年Tansformer架構橫空出世使得技術大規模爆發,2018年的創業熱潮之後。2019年,資本退潮、技術瓶頸期、場景難落地,開啟了人工智能史上的“亂紀元”。
沒有人知道通用人工智能何時到來,就像三體人不知道太陽會在何時升起。
那一年,大批AI公司陷入裁員風波、資金鏈斷裂、產品難產,能堅持至今的,所剩寥寥。
但也正是在2019年,AI新的希望開始孕育:OpenAI在7月接受了微軟的投資並與其深度合作,如今讓世人震驚的GPT-3正是從那一年開始研發;國內最早樹立AI戰略的百度,從年初就開始進行了一次長達半年的人事調整,如今看來,重新排兵布陣,似乎是開啟了長達4年的堅守期。
2019年,王海峰晉陞為集團CTO,繼續擔任AI技術平台體系(AIG)和基礎技術體系(TG)總負責人,兩者是百度最重要的技術底座;沈抖晉陞為高級副總裁,全面負責移動生態事業群,隨後在2022年又調任至百度智能雲,成為百度第二增長曲線的開拓者;而在2019年引進的一批新生力量中,何俊傑是唯一一名80后百度副總裁,先是負責投資併購和戰略投資,后又被重用,負責沈抖空缺出來的移動生態事業群,實權更加在握。
時間來到了2023年,Transformer的能力在這一年終於由OpenAI打破了天花板,進階到一個新的層次,技術的突破讓OpenAI一舉成為全世界最受矚目的公司。微軟蓋過了谷歌的科技光輝。
在過去四年裡,百度的核心業務形成了由沈抖領軍智能雲,何俊傑負責移動生態,王海峰壓陣技術的三角結構,百度也終於結束了靜默期,開始轉守為攻,動作不斷。
“重新把每個應用都做一遍”,是經歷了半年蓄力后的第一次亮劍,如今的百度像一顆行星,即將遇到巨大的“技術引力場”,而徹底改變軌道。
2017年,谷歌在一篇名為《Attention Is All You Need》的論文中,提出了Transformer架構,以替代傳統的RNN和CNN循環模型,論文中展示了Transformer的訓練準確性高於之前所有模型,訓練時間明顯低於之前的模型,在訓練集內容較少時訓練效果也很好。
這之後,Transformer架構迅速被接受並應用在了NLP和CV領域,尤其在NLP領域,注意力機制讓機器能夠更準確地理解語義並生成,以及減少信息重複。
作為最早一批發現並跟進Transformer技術路線的公司,百度已經在NLP領域研究超過十年之久,並已經組成了一支由王海峰、吳甜、吳華等頂尖專家組建起來的精悍的NLP隊伍。
王海峰
彼時,NLP團隊成立的第一個重要任務,是打造百度翻譯。王海峰將深度學習和神經網絡大膽應用在翻譯中,加強機器對上下文的理解,形成更流暢的譯文。這一勇敢嘗試也讓百度翻譯成為第一個支持200多種語種的翻譯系統,甚至比Google還早了一年零3個月。
這也是大模型四大核心能力“理解、生成、邏輯、記憶”中,理解能力的雛形。
但王海峰覺得,NLP還不夠。他專門跑到李彥宏辦公室去做彙報,提出了下個“登陸的諾曼底”——語音識別。他的理由是,語音識別技術馬上要到產業化的臨界點,一旦突破很快就會大規模商用。
李彥宏憑藉著自己對技術的判斷,決定再次支持王海峰,陸續建立了與NLP部門平行的“語音識別部門”、“圖像識別部門”和“知識圖譜部門”。
王海峰的一通操作讓很多百度的同學不解,“這些技術和百度現在的產品也沒關係啊,一股腦創建這麼多部門,是攢着過年么?”
彼時的王海峰,正是看到了搜索數據對於大模型形成邏輯有着非常強大的支撐。“百度有世界上最大的搜索引擎,搜索引擎不僅信息時效性很強,也有很高的準確率,可以構建最全的知識圖譜”,王海峰曾在公開採訪中解釋道。
在打造文心一言之前,百度沉澱了擁有超過50億實體、550億事實的多元異構超大規模的知識圖譜,能夠通過語言、聽覺、視覺等獲得對世界的統一認知。其在2021年發布的知識增強大模型——ERNIE(文心)3.0,正是文心一言的前身,該項目由吳甜主要負責。
吳甜
又是2019年,百度文心1.0發布,在4年時間里迭代了3個版本。2022年11月,吳甜在公開峰會中同時公布了文心已經累計的11個行業大模型,涵蓋電力、燃氣、金融、航天等領域,產業生態初步形成。
這些,都為百度搶先發布文心一言做了伏筆和鋪墊。3月16日,文心一言發布之後,百度再次回到鎂光燈下,但比肯定更多的,是質疑。
“市場需求這麼旺盛情況下,誰先做出來還是意義非常大的”,李彥宏曾在採訪里講到,即便產品並未完全成熟,但仍然要發布的原因:“文心一言發布之後,無數的人,過去不怎麼聯繫或者行業跟我隔得很遠的人都在問,我們怎麼能跟百度合作,怎麼儘早試用”。
從技術的角度,大模型更是“越用越靈”的高速迭代。“內測的時候,員工問,文心一言怎麼藏頭詩寫不好?我說等等吧,明後天估計就能學會了,結果第二天果然就能用了,大模型的進步也是一個不斷學習的過程”,王海峰笑道。
在半年時間里,文心一言從3.0到3.5,再到4.0版本進行了三次迭代,據王海峰在會上介紹,文心一言用戶規模已經達到4500萬,開發者5.4萬、場景4300個、應用825個、插件超過500個。
在NLP澆的水,施的肥,終於在2023年迎來了豐收,也正如李彥宏所講,技術發展的路徑,是“一生二、二生三、三生萬物”的過程。
通用人工智能爆發之後,雲計算的關注度和企業重視程度到了頂峰,也隨即來到了“iPhone時刻”。
大模型的出現,產生了巨大的算力缺口,雲計算既為大模型提供雲算力支撐,又是大模型落地企業的最佳着落點,無論是百度還是任何一家擁有大模型的企業,當大模型面世,下一步的重點便是推向市場,讓企業用起來。
對於百度而言,這樣的重擔,落在了沈抖肩上。
沈抖
在百度的六大事業群負責人中,除了CTO王海峰,沈抖是唯一一個高級副總裁。雖然同為技術出身,但和王海峰的“工程師”角色不同,沈抖從加入百度開始,就一直在負責關鍵業務的增長。
加入百度的10年裡,沈抖先後整合了廣告投放系統,提高了系統變現能力;將搜索和feed信息流進行結合;整合了由搜索升級后的移動生態事業群,補齊了百度移動生態的版圖。
如果說,王海峰打造了一把尖刀,那沈抖則是能利用這把尖刀,開拓疆土的先鋒官,用李彥宏的話說是“敢打硬仗、能打勝仗”。
2022年5月,沈抖輪崗為百度智能雲(ACG)事業群總裁。於百度而言,最開始並沒有全力押注云計算,但也正是隨着人工智能技術的不斷髮展,讓百度意識到了雲計算短板后,開始暗自發力,默默培養第二增長曲線。
由於沒有先發優勢,百度雲過去10年的目標都十分明確,不和“老炮”們比拼IaaS層的規模化,而是通過PaaS+SaaS與智能化能力的結合,打出差異化,並以小搏大地切入企業数字化。
2023百度世界大會上中,沈抖再次提出“雲智一體”戰略:“人工智能與雲計算的深度結合是企業快速落地AI原生應用的關鍵。目前,百度集團所有應用和服務全部基於‘雲智一體’技術架構運行在百度智能雲上”。
據光錐智能觀察,雲智一體戰略的核心在於,一方面,以百度智能云為依託,可以快速為企業提供整套的大模型服務;另一方面,大模型也推動着企業数字化的門檻變得更低。
在接手ACG后的5個月里,沈抖針對企業在大模型時代的核心需求,迅速整合出了“大模型服務超級工廠”——文心千帆,並按需求將用戶分為五大類用戶。
首先,針對算力資源所產生的需求缺口,千帆平台提供各類異構算力。比如在耗費最多訓練環節,通過分佈式并行訓練和微秒級互聯能力,千帆平台可以實現萬卡集群訓練加速比達到95%,有效訓練時間佔比達到96%,大幅降低客戶算力和時間成本。
其次在模型層面,對於希望直接調用已有大模型的客戶,企業可快速調用包括文心一言在內的多個大模型,同時千帆平台提供中文增強、性能增強、上下文增強等工具。據沈抖透露,目前千帆平台已經服務超過1萬7千家客戶。
針對有二次開發需求的客戶,千帆平台為大模型提供再訓練、微調、評估和部署等全生命周期工具鏈,業界最多的41個高質量行業數據集,並針對自身業務場景快速優化。
大會現場還進行了如何基於檢索增強生成(RAG,Retrieval Augmented Generation)框架,為三一重工快速開發知識問答應用的實操演示:只需在千帆AI原生應用工作台中選擇預置的RAG框架,進行相應的參數配置等工作,就可以快速實現三一重工官網智能客服應用的開發與上線。
沈抖表示,搭建這樣一個“小助手”,即使需要處理幾千篇萬字長文檔,成本也只需幾百塊錢;而之後用戶每次諮詢,成本僅需幾分錢。
一直以來,大型工業、製造業、農業都是数字化的深水區,核心原因就在於產業的複雜性導致了数字化的門檻高,難以落地。
但通過大模型,既降低了使用門檻,也降低了使用成本。不需要打造任何新系統,也不需要人工參与,是技術組件的一個更高級的應用方式,二者結合,也轉起了雲智一體的飛輪,逐步蓄力。
過去已成定局,未來卻可以改變。
所有擁有了大模型的廠商,都發現了應用層的機會。微軟在3月份就開始動刀包括Bing、Office、Windows系統在內的全線產品,阿里張勇講道:“要用大模型把所有產品重做一遍”,然而這句話,說起來簡單,做起來卻是大模型時代最大的創新挑戰。
AI如何重構應用?這不僅要業務能力,更需要想象力,面對一個新的AI時代,百度也將指揮棒交到了年輕人手裡。
2022年5月之後,接替沈抖作為MEG事業群負責人的,是百度人才梯隊建設計劃中引入的80后副總裁——何俊傑。如果說沈抖是“硬戰派”,那何俊傑就是名副其實的“少壯派”。正如任正非所說,要“讓聽到炮聲的人指揮戰鬥”。
重構應用,是不破不立,對比來看,百度對自己,確實“下手特別狠”。
百度世界大會,圍繞“生態”,何俊傑交出了“移動生態”、“內容生態”和“商業生態”的答卷。
其中,移動生態涵蓋了“新搜索”、“新文庫”、文心一言APP、百度電商“慧播星”等AI原生應用;內容生態層面,通過百度APP“AI編輯器”等一系列應用為創作者生態賦能;商業生態層面,推出AI Native營銷平台“輕舸”。此外,何俊傑還公布了文心一言插件生態——“靈境矩陣”,現已全面開放。
百度所定義的新搜索,正是延續了2010年李彥宏提出的框計算的邏輯。具備極致滿足、推薦激發和多輪交互三個特點。即用戶搜索問題時,“不再給你一堆鏈接”,而是通過對內容的理解,生成文字、圖片、動態圖表等多模態答案;推薦激發則可以實時推薦用戶關心的問題;在針對複雜需求時,多輪交互可以通過提示、調整等方式,滿足用戶個性化的搜索需求。
需求到匹配的過程,也稱之為“端到端”搜索,但這會打破百度曾經賴以生存的競價排名模式,廣告收入也是一直以來百度最大的現金牛,自己革自己的命並不簡單,百度後面還有一場硬仗要打。
AIGC的能力讓一部分百度老應用有了新的活力,比如百度文檔從內容檢索工具升級為了內容生產工具、百度編輯器成為了內容生成工具;另一部分也探索了新的場景,比如百度輕舸通過AIGC一站式生成營銷內容並智能投放,結合数字人生成平台“慧播星”幫助商家擴大營銷範圍和場景。
同時,隨着大模型應用的逐步落地,百度也意識到憑藉一己之力終究有限,無限的是合縱而連橫。
這正是靈境矩陣的價值所在,這一平台大大降低了大模型插件開發的成本,讓有創意、有想法的普通人,也能成為插件開發者。李彥宏表示,插件是一種特殊的AI原生應用,也是門檻最低,最容易上手的AI原生應用。
插件的特點在於“萬能接口”,既可以連接搜索、小程序、內容平台也可以連接任何入口,這樣“即插即用”的使用方式,能讓開發者、創作者快速加入到生態中。
何俊傑透露,上線一個月,靈境矩陣已經收到2.7萬個開發者註冊申請,覆蓋了20多個垂直領域,其中包括企業、機構和個人開發者。
一位百度內部人士告訴光錐智能:“應用層的大模型插件以靈境為主要平台,會放在文心一言和百度App中。千帆更偏底層調用,靈境更偏上層,甚至未來有可能在應用插件層面會替代千帆”。
2016年,李彥宏曾說,百度離破產只有30天。“恐龍腳上踩到一個瓢,幾個小時以後他的腦子才能反應過來。所以不管恐龍長到多大,都會滅絕”。
百度不想做恐龍,在意識層面,總是想着十步以外。
幸運的是,百度等到了新時代,度過了最艱難的時刻;不幸的是,在這個新時代的開端,任何費勁心力的搶跑,都會在漫長的競爭下顯得微不足道。
但拿到了新的船票,至少是一個新的開始。
資料參考:
https://blog.csdn.net/futuregislab/article/details/129619234《人工智能各領域跨界能手——Transformer》
https://zhuanlan.zhihu.com/p/343409729《此行向遠:他們為人工智能雕刻靈魂》