所有語言
分享
來源:AI黑馬
作者:彭輝 360集團副總裁
大模型以它普惠、泛在和通用的特徵,未來將走進千家萬戶,賦能千行百業。
所以,我們有這樣一個觀點:
每一個家庭,每一個政府,每一個企業,都會擁有一個甚至多個大模型。
我們還認為,中國跟美國在To B市場上的發展有很大的不同。在中國落地不會產生垄斷,大模型絕對不會只有3-5個大模型。
未來大模型一定是無處不在,未來的發展機遇一定在企業級市場。
大家都知道,数字化已經成為我們國家的一個核心戰略,產業数字化將是未來巨大的去中心化的增量市場。
所以,在中國做大模型,我們堅定地認為要抓住這樣一個戰略機遇,去做產業的一個賦能,錨定產業級的市場,把大模型從所謂的中心化的市場拉下神壇,去提升政府和企業的生產力和生產效率。
當然,在這個過程當中,大模型在企業級市場的落地過程當中將遇到巨大的一些挑戰。
我把它總結為四個方面:
1)專業領域知識匱乏。
大家都知道我們會用大量的互聯網的語料餵給大模型,它就像一個高中生,頂多是一個本科畢業生。但是它在某些專業的領域知識、行業知識和企業內部的知識上,極其匱乏。甚至不能及時更新。所以,這是一個大問題,專業知識的匱乏。
2)偶爾幻覺胡說八道。
大家都經常講一句話,大模型會一本正經地胡說八道。它會存在知識模糊和知識幻覺。因為數據和知識就像結構化數據庫一樣,只是採用了另外一個矩陣向量的方式被編碼在了我們深度神經網絡的這種參數和權重裏面。但是,我要調用它,使用它,實際上是需要更好的Prompt去做引導。在這個過程當中,它的算法機理會產生內容的一種幻覺,無法保證真實和可信。
3)安全問題。
企業不願意將自己的獨門絕技貢獻給公有大模型,或者訓練進一個公有的大模型當中。
4)成本問題。
現在英偉達H100的供給都是缺貨狀態,ChatGPT號稱訓練一次幾萬張卡。所以,這種投入對一個普通的企業來講是非常困難的一件事情。我們可能降低了人力,但並沒有降低成本。
所以,如何解決這些問題?
我們認為,未來的一種發展趨勢,一定是走向垂直化,打造小而專的垂直大模型。
不可能依靠一個單一的、萬能的通用大模型去解決所有的任務分解、人機交互和知識問答的問題。我們一定要依靠企業級的數據語料和高質量的數據去訓練小規模的、專有化的垂直大模型。
大模型未來將成為所有数字化系統的一個標配和組件。
我們走訪了100多家企業客戶和合作夥伴,大家基本上有一個共識:
大模型目前並不是萬能的。
所以,問題就變成了:如何更好地將其應用到企業的場景當中?
我們需要去讓所謂的通才變得專業化,變成真正的政府通和企業通。
這時,我們要找到小的切口,發揮它的長處。
我們認為大模型目前的能力主要體現在文本生成,或者說內容創作和知識問答這兩個能力上。我們可以從這兩個能力去入手。
越來越多從事大模型行業的從業者,都相信在相對聚焦和狹窄的應用場景當中,更小和微調的大模型,將更快達到To B端準確性的要求。
所以,我們一定要循序漸進,先讓大模型做好助手,先讓大模型當好導航。
圍繞這樣一個場景,我們從對上、對下、對內、對外四個維度,找到相應的適應這四個產品快速發揮它的生產力和效能的應用場景。
1)在對內的場景,我們認為更多的是辦公的寫作和總結。
2)在對外的場景,大量的数字人開始出現在客服場景中。
3)在對上的場景,我們強調信息和情報的總結和分析。
4)在對下的場景,我們可以讓大模型做企業知識,甚至崗位技能的系列培訓。
所以,在整個落地實踐過程當中,我們意識到一個很重要的點。未來我們80%以上的業務場景,都將跟企業的知識庫密切相關。
過去我們做大數據,都停留在結構化數據的應用。要知道,80%的非結構化的知識和數據是被遺棄,或者放置一邊不管的,這一部分的大數據將成為大模型訓練的語料。
所以,怎麼從企業的一個大數據的基座裏面,把有價值的知識,高質量的精標數據抽取出來,轉化為企業的私域的知識庫,通過檢索的校正和增強來賦能大模型,真正能夠在To B的業務場景當中產生內容的可信和及時的內容更新,以及分權、分域的這樣一個內容的安全。
數據是分三重門的:
第一重門可能是公開的互聯網的數據,第二重門是半公開的行業數據,或者企業的數據,還有一部分是企業內部的機密的數據。
對於這種企業的機密數據和有權限的數據而言,我們必須將它放到一個企業的知識庫里,或者放到一個向量數據庫里,讓它產生有權限,有審計的一種管理,通過分類分級的企業知識的一種權限管理,通過大模型的檢索增強,從而能夠提供更加精準的知識和賦能。
另外一個方面就是應用,在應用層面,大家都接觸過ChatGPT,大家覺得好用嗎?
為什麼前段時間所有的大腦都在提未來會創造很多的提示工程師的這樣一個崗位和角色,實際上它是非常複雜的。
我們要讓它寫一篇好的文章,要給它非常多的提示、中心思想、摘要、提綱,才可能讓它寫出一篇好的文章,我們讓它做一幅圖,用Midjourney,我甚至要告訴它你要用多少毫米的鏡頭、焦距、光圈,然後景深,什麼樣的環境才可能做出一幅真正漂亮的生成的這樣一個圖片,但是這樣的一個Prompt的提示工程實際上只是可用,但是非常不好用和不易用。
所以,在未來發展過程當中,不要迷信所謂的language UI,更多的傳統的界面不會被淘汰。
而且,會大量的在未來的辦公寫作、生圖、營銷創意等等這樣的場景裏面,甚至政務的知識問答場景裏面來產生,因為它提供了更多的直觀和應用性。
舉個例子來講,老周經常講一句話,就想吃盤土豆絲,我想要熗炒的,不要醋熘的,不想加醋,我要講這樣一句話其實很複雜,但是通過我菜單的點選,可能是一個秒級別的,我就做完了這件事情。
360將發布自己的企業級GPT的整個產品體系框架。底層我們依然認為數據和知識將成為未來企業級大模型的一個底座,離不開過去所有數據的積累,只是我們要適配大模型的需要,去對過去所有企業積澱下來的數據,非結構化的內容和文檔,包括多媒體的音視頻的圖形、圖像數據,經過多元的數據連接器和知識追蹤的機器人,推動多源數據的一個處理引擎把它納入到我們企業的知識庫裏面,通過向量的索引,傳統意義上的摘要索引,文本索引和多模態的索引,構建起一個企業級大模型的一個知識的底座,然後通過我們的搜索和知識的增強,賦能給我們專業垂直的企業大模型向上提供服務。
1)辦公寫作。
我們會把複雜的Prompt工程隱藏在不同的15類的大模板和接近80類的細分的公文模板的背後。利用這樣一個工具來高效完成公文寫作,有效地解決公文寫作過程中的耗力費時和質量低的這樣一個問題。
2)政務服務。
通過大模型加上政務的知識庫,我們可以通過多輪對話,讓大模型像人一樣去做語義的理解,通過追問和補問來補充相關信息,最後形成問答。可以客觀、準確地回答老百姓在辦事過程當中的所有問題。
3)文旅数字人。
老周在很多場合也提到過文旅数字人。大家都做過旅遊規劃,單純一個所謂的旅遊行程規劃,是否能夠解決你的旅遊問題?
我們關注的是,落地到一個目的地后,有一個本地朋友,一個本地的導遊。我關注的景點、美食、趣聞軼事、段子,這些東西如何成為一個目的地為中心的数字伴侶?我們要打造這樣一個数字伴侶,未來將逐步的在政府的主導下打通中台能力,把我們的OTA、當地的酒店、餐飲接入進來之後。
結合360集團自身,以及100多家企業客戶和合作夥伴,我們形成了目前為止最佳實踐的落地流程。
第一步,業務分析與場景選擇。
第二步,數據採集與清洗準備。
第三步,訓練企業專有大模型。
第四步,開發企業場景化應用。
我們認為,所有大模型在企業級場景落地,優先要考慮的一個事情依然是業務分析。它跟数字化並沒有什麼不同。
我們依然要在業務分析的過程當中去找到業務的痛點,從而找到適配的一個場景,選擇出這個場景之後,定義我們的解決方案。
然後,圍繞這個場景去做數據和知識的採集、清洗,形成我們高質量的、標註的這樣一些數據。入庫之後,一部分作為語料餵給我們的垂直大模型去訓練,一部分進入我們的企業知識庫來做知識的一個搜索增強。然後才是開發智能助手也好,数字員工也好,数字人也好,通過模型的應用編排和API對外開放,與現有的業務系統進行集成。
企業級大模型在落地過程當中,我們非常強調,離不開雙方業務和技術專家的緊密協同。