所有語言
分享
文章來源: AI科技大本營
整理 | 王軼群
責編 | 唐小引
5月,大模型降價忙。
AI 降價潮愈演愈烈,國內國外都開啟了新一輪的 AI 價格戰。
國內AI價格激戰:降價、大幅降價、直接免費!
國內互聯網大廠,包括阿里、字節、百度、騰訊,以及背靠雄厚資本的創業公司,持續發布 AI 及大模型產品,同時逐步加快了降價的節奏,從降價、大幅降價,到直接免費、立即生效!
事情開始於1元可以購買100萬tokens。
5月6日,私募巨頭幻方量化的AGI(通用人工智能)的新組織“深度求索(DeepSeek)”開源第二代 MoE 模型 DeepSeek-V2,把價格打到了僅為GPT-4-Turbo的近百分之一。其API的定價為:每百萬tokens輸入1元、輸出2元(32K上下文)。
5月13日,智譜大模型開放平台上線了新價格體系,入門級產品 GLM-3 Turbo 模型調用價格下調80%,從5元/百萬tokens降至1元/百萬tokens。調整后,1元可以購買100萬tokens,使用 GLM-3 Turbo 創作一萬條小紅書文案(以350字計)將僅需約1元錢。
大廠也同樣不甘示弱。
5月15日,字節跳動發布豆包大模型,定價大幅低於行業價格。豆包主力模型在企業市場的定價僅為0.0008元/千tokens,即0.8厘就能處理1500多個漢字,比行業便宜99.3%。
在5月9日發布通義千問2.5之時,阿里表示個人用戶可以通過 APP、官網和小程序免費使用通義。而不到兩周后,在5月21日,阿里通義千問開啟降價。由此,1元可以購買100萬tokens,被阿里卷到1元最多可購買200萬tokens。
通義千問 Qwen-Long 的 API 輸入價格大幅下調,從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味着1元錢可以購買200萬tokens,相當於5本《新華字典》的內容。該模型最高支持1000萬tokens的長文本輸入降價后的價格約為 GPT-4 的1/400。
阿里的這波降價加限時免費,一定程度上已經超越了前幾次其他廠商的大模型降價。但,這並沒有讓阿里坐穩價格戰的頭把交椅,甚至屁股都沒坐熱,就被打着“全面免費”的百度趕下。在阿里宣布如此大幅降價的當日,5月21日晚些時候,百度宣布文心大模型的兩大主力模型將全面免費,立即生效。
之前咬緊的降價潮,被百度再卷一次,迎來了全面免費的階段,國內大模型價格戰的正式打響。
隨後,僅在第二天,全面免費風頭就歸屬到了卷王騰訊雲。5月22日,騰訊雲直接“一鍵三連”:正式對外宣布旗下AI代碼助手全面對外開放,公布了全新大模型升級方案,API 輸入價格大幅下降,混元-lite模型全面免費。
騰訊雲主力模型之一混元-lite 模型,API輸入輸出總長度計劃從目前的4k升級到256k,價格從0.008元/千tokens調整為全面免費;混元-standard API 輸入價格從0.01元/千tokens降至0.0045元/千tokens ,下降55%,API輸出價格從0.01元/千tokens降至0.005元/千tokens,下降50%;混元-standard-256k,具備處理超過38萬字符的超長文本能力,API輸入價格下調至0.015元/千tokens,下降87.5%,API輸出價格下降至0.06元/千tokens,下降50%;最高配置萬億參數模型混元-pro,API 輸入價格從0.1元/千tokens降至0.03元/千tokens,降幅達70%。
騰訊雲表示,以上價格調整自發布之時立即生效。
國內的 AI 價格戰,在本周打得尤為激烈。不僅模型參數及性能捲起來了,價格更是卷到飛起!從1元可購買100萬個tokens,到最多可買200萬個,再到免費,最後到全面免費。甚至有業內人士笑稱,眼瞅着下一家跟進的廠商可能就得發錢補貼讓客戶用 API 了。
國外AI:扎堆發布、降本至免費,英偉達坐收漁翁之利
在國內降價免費之前,國外已經走過了一輪大模型降價和免費階段。
5月初,谷歌就表示其AI聊天機器人的問答成本在過去一年中銳減了80%。這標志著谷歌在 AI 領域再次取得了重要突破,通過 Gemini AI 模型和定製AI芯片的技術革新,谷歌有效降低了 AI 搜索的運營成本。
不僅降本,谷歌還直接免費。一個月前,在4月10日,谷歌最強大模型Gemini 1.5 Pro“全面”對外開放,完全免費。Gemini 1.5 Pro100萬的上下文窗口這次也直接對外開放,可以處理的最長音頻約為11小時,最長視頻則為1小時。谷歌官方給這次免費開放的Gemini 1.5 Pro版本定義為“公開預覽版”,主要面向開發者,可在谷歌AI Studio中獲得API密鑰。這是在 Gemini Ultra 免費試用兩個月之後的又一次大模型免費舉動。
攪動渾水的鯰魚,非 OpenAI 莫屬。偏偏趕在谷歌 I/O 大會同一時間的前一天,在5月13日,OpenAI 推出了一款名為 GPT-4o 的“旗艦級”生成式人工智能模型,面向所有 ChatGPT 的付費和免費用戶,取消其他所有限制,API 價格降價50%。
OpenAI這波對谷歌的阻擊力度不小。雖然OpenAI宣傳的是“取消所有限制”,但據使用者反饋,也存在每天的使用限制。其免費層的用戶將默認使用GPT-4o,但使用 GPT-4o 發送信息的數量有限制,這將根據當前的使用情況和需求而變化。不可用時,免費層用戶將切換回GPT-3.5。
第二天,谷歌 I/O 大會以近10個大模型的升級發布絕地反擊。
谷歌向全球所有開發者推出 Gemini 1.5 Pro 的改進版本,擁有 100 萬個 token 上下文的 Gemini 1.5 Pro 現在可以直接在 Gemini Advanced 中供消費者使用;將 Gemini 1.5 Pro 上下文窗口擴展到了 200 萬個 tokens,並以私人預覽版的形式提供給開發人員;比 Gemini 1.5 Pro 更輕量級的 Gemini 1.5 Flash 發布;發布可製作“高質量” 1080p 視頻的 Veo 模型和文本生成圖像模型 Imagen 3;發布採用全新架構、27B 大小尺寸的 Gemma 2.0;推出第一個視覺語言開放模型 PaliGemma。
一周后,微軟在 Build 開發者大會上也頻頻出招。僅僅在第一天兩個多小時的演講中,微軟就宣布了50多項更新,包括AI基礎設施、模型產品落地等多方面。
在谷歌預覽具備語音交互和視覺記憶的AI智能體 Project Astra 后,微軟在會上發布 Team Copilot 智能體,作為 Copilot for Microsoft 365 的擴展,該智能體更注重在執行工作任務上,能夠提升整個團隊的工作效率,完成主持會議、跟蹤並安排項目進展等任務。同時,微軟宣布將 OpenAI 上周更新的ChatGPT-4o接入Azure雲平台,可對外提供API。在垂直領域應用上,微軟還與可汗學院合作為 K-12 教師免費提供人工智能Agent,並將開發 Phi-3 數學模型。
在國外,無論是行業應用還是基礎模型,國外大模型的市場份額都牢牢被明星創業公司和大廠佔據,要麼是 OpenAI、谷歌、Meta 等科技巨頭,要麼是有傳統科技巨頭大手筆投資的 Anthropic、Mistral AI 等明星初創公司。
然而,佔據大部分市場份額的AI公司,其盈利能力卻一直不達預期。連 Meta 這樣的巨頭也無法指望立刻從AI中獲利,Meta 在2024年增加了高達100億美元的基礎設施支出,但預計多年內不會從其 AI 產品中賺錢。
那麼,AI 浪潮仍在激烈奔涌下,真正賺錢的是誰?算力巨頭英偉達坐收漁翁之利。在最新公布的財報中,英偉達獲得了創紀錄的季度收入。據其發布截至4月28日的2025財年第一財季報告,各項數據全面超越預期的狀態。
英偉達第一季度實現收入260億美元,比去年同期增長262%;凈利潤為148.8億美元,同比增長高達644%。英偉達預計,截至7月的本季度營收將達到280億美元,是去年同期的兩倍多,也高於華爾街的預期。
在隨後的電話會議上,首席財務官科萊特·克雷斯預計,每花費1美元採購英偉達人工智能基礎設施,雲提供商在未來四年內就有機會通過提供算力服務(GAAS)賺取5美元收入。
可見,在算力和數據這開發大模型無法繞過的兩大難點上,佔一頭的優勢,英偉達就獲利頗豐。
誰在獲益,誰在被裹挾,免費保增長還是收費報成本?
增算力,獲數據,擴市場,這是成為時代 AI 基建的底層邏輯。
目前,算力層面英偉達一家獨大。AI模型廠商的眼光就瞄準在了市場、用戶和數據規模上。降價,免費,多性能多產品,即為保增長的獲客之道。
事實上,降價並沒有真的損失多少收入,畢竟大家都沒有英偉達賺錢,都沒完全跑通商業模式。激活下市場,在行業降價潮中及時入場賺個吆喝,促進企業從“免費試用”開始下水,擴大大模型API的調用量,有助於早點啟動大模型發布公司對 AI 進入業務流的嘗試。
過去一年,國內大模型廠商在過去一年也做了一系列探索來降低 AI 應用的門檻,以期擴大大模型的調用量,但結果都不及預期,標準化的模型 API 並沒有迎來確定性的增長,不如直接降價、免費來得直接。
降價免費,降低使用門檻,促使更多用戶使用、更多的API調用,就能帶來更大市場,獲取更多數據。
數據是AI模型的基礎,AI 模型訓練獲取適合數據的難點和痛點在於:
根據HAI研究所的AI報告,訓練巨型模型的成本呈指數級增長,谷歌 Gemini Ultra 的訓練成本估計為1.91億美元,GPT-4 的訓練成本估計為7800萬美元。
降價和免費,也是獲取更多可篩選訓練優質數據的方式之一。科技博主寶玉表示,現在 AI陷入價格戰了,AI服務商都陷入了免費保增長還是收費保成本的兩難境地。
免費保增長,還是收費保成本?明顯,大廠的選擇是先降低使用門檻,然後逐步實現商業化。可以看到,本次降價中,降得最凶的都是有雲服務的大公司。“這些雲服務商通過大模型來獲取雲用戶,羊毛出在豬身上,降得起。”傅盛表示。
想收費保成本的小廠正在這波降價潮中面臨尷尬。大廠和明星創業公司可以隨意降價,但由此引發的市場競爭加劇,普通 AI 大模型創業者就被裹挾其中。
科技巨頭憑藉雄厚的財力、廣泛的數據存儲庫和大量的算力基礎設施,在底層模型上可以建立牢固的立足點,明星創業公司背後站着明星投資機構。而初創公司,除非依靠大公司的財力,幾乎沒有能力承擔模型的高訓練成本,也沒有先發優勢,不能跟大廠直接對抗,除非瞄準差異化需求,做垂直細分的賽道,否則很難在裹挾中前進。
目前,行業能形成價格戰的連鎖反應,也由於當前各大模型的能力放在可用的場景中,尚未拉開差距,用戶可選擇空間大,甚至有免費開源產品可用。也有質疑聲音稱一些降價的模型本身吞吐量就低,而高性能模型並沒有降價,且還有很多細節條款會讓最終企業用起來沒有宣傳的那麼便宜。
需要注意的是,只提供模型的 API,距離 AI 應用在場景中落地還有很大距離,大部分 AI 應用還需要在一個通用的模型 API 之上,在場景里喂數據、做微調等來優化模型引擎。
若一個通用的模型 API 無法深度適配場景,企業用戶往往還是要自己基於開源模型,用場景數據做專門的深度訓練,並不會接通用的模型 API。無論使用門檻再低,如果與用戶需求不適配,依然換不來增長。
卷價格來的直接,但不如卷精準符合用戶的需求來的實在且長久。
參考鏈接:
https://mp.weixin.qq.com/s/HA4RtjXvUhOY-sdHXYvUpg
https://baijiahao.baidu.com/s?id=1799742413819805747&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1799762991336129582&wfr=spider&for=pc