本文原載於 a16 z 官方部落格,標題為 Who Owns the Generative AI Platform?,作者為:Matt Bornstein, Guido Appenzeller, and Martin Casado,本文大部份為 AI 翻譯,並經些許編修而成
我們正在目睹生成式人工智慧技術架構的早期階段,數百個新創公司正在爭相進入市場,不管是開發基礎模型、構建人工智慧原生應用程式或者建立基礎設施/工具。
許多熱門技術趨勢都在市場沒有跟上前被過度誇大,但是生成式人工智慧的繁榮已經得到真實的市場收益與推廣。Stable Diffusion和ChatGPT等模型正在刷新使用者成長的歷史記錄,幾個應用程式在推出不到一年後就達到了1億美元的年化收入。在某些任務中,人工智慧模型的表現優於人類許多數量級。
因此,有足夠的早期數據表明,市場正在發生巨大的轉變。我們不知道的,且現在已經成為關鍵問題的是:在這個市場中,價值將會在哪裡積累?
在過去一年中,我們接觸數十位創業者和大公司直接涉及生成人工智慧的營運商。我們發現,基礎設施供應商可能是目前為止市場上最大的贏家,擁有最多的金流。應用公司的收入快速增長,但通常面臨留存困難、產品區分度不足和毛利率的問題。並且,大多數模型提供商,儘管對這個市場的存在負有責任,但還沒實現足夠大的商業規模。
換句話說,創造最多價值的公司,即訓練生成人工智慧模型並將其應用於新的應用程式,尚未捕捉大多數價值。預測下一步會發生什麼更加困難。
但我們認為要理解的關鍵是,差異化和可防禦的部份。這將對市場結構(即水平公司與垂直公司發展)和長期價值的驅動因素(例如利潤和留存率)產生重大影響。到目前為止,我們在堆疊(Stack)中很難找到結構防禦,除了現有者的傳統壟斷。
我們對生成式人工智慧非常看好,並相信它將對軟體行業和其他行業產生巨大影響。本文的目的是描繪市場的動態,並開始回答有關生成式人工智慧商業模式的更廣泛問題。
高階技術堆疊:基礎架構、模型和應用程式
要了解生成式人工智慧市場如何形成,我們首先需要定義當前的堆疊情況。以下是我們初步的看法。
這個堆疊可以分為三層:
- 將生成式人工智慧模型整合到以使用者為對象的產品中的應用程式,要嘛執行自己的模型流水線(「點對點應用程式」),要嘛依賴第三方 API。
- 驅動人工智慧產品的模型,以專有 API 的形式提供,或作為開放原始碼出口(這需要一個代管解決方案)。
- 執行生成式人工智慧模型的基礎架構供應商(例如雲端平台和硬體製造商)。
請注意:這不是市場地圖,而是分析市場的架構。在每個類別中,我們列出了一些知名供應商的例子。我們沒有試圖涵蓋所有已發布的生成式人工智慧應用程式,也沒有深入探討 MLops 或 LLMops 工具,這將在以後的文章中討論。
第一波生成式人工智慧應用程式正達到規模化,但在留存和差異化上有困難。
在以往的技術周期中,傳統的智慧是,要建立一個大型的獨立公司,您必須擁有終端客戶 — 無論是個人消費者還是B2B買家。我們很容易去相信生成式人工智慧的最大公司也將是終端用戶應用程式,但到目前為止,還不清楚是否如此。
當然,生成式人工智慧應用程式的成長令人驚嘆,這是因為純粹的新奇性和海量的用途。事實上,我們已經知道至少三個產品類別已經超過了1億美元的年度收入:圖像生成、文案寫作和程式碼寫作。
但是,僅僅是成長是不夠的,必須創立可持續的軟體公司。重要的是,成長必須是有利可圖的 — — 在意義上,用戶和客戶在他們註冊後產生利潤(高毛利)並長期留存(高留存率)。在缺乏強有力的技術差異性的情況下,B2B和B2C應用程式通過網絡效應、持有數據或構建越來越複雜的工作流程來提高長期客戶價值。
在生成式人工智慧中,這些假設並不一定成立。根據我們與多家 app 公司的談話,毛利率存在很大差異,最高可達 90%,但也有 50–60% 的情況,主要是由使用模型的成本所驅動。漏斗頂端的成長非常驚人,但目前的客戶獲取策略是否具有可擴展性尚不清楚,我們已經開始看到付費獲取效率和留存率開始下降。許多應用程式也相對沒有差異性,因為它們依賴於相似的基礎人工智慧模型,並且還沒有發現明顯的網絡效應,或者對競爭者而言,難以複製的數據/工作流程。
因此,目前尚不明顯,以終端用戶 app 的銷售作為建立可持續生成式人工智慧業務的唯一或最佳途徑。隨著語言模型的競爭和效率的提高(在下面有更多相關內容),毛利率應該有所提高。當人工智慧遊客離開市場時,留存率應該會增加。也有強有力的論點認為,垂直整合的應用程式在推動差異化方面具有優勢,但還有很多東西仍有待證明。
展望未來,生成式人工智慧應用軟體公司面臨的一些重要問題:
- 垂直整合 (「模型 + 應用程式」)。作為服務消費人工智慧模型可讓應用程式開發人員快速迭代,並隨著技術進展輕易更換模型提供者。另一方面,一些開發人員認為產品就是模型,並且從頭訓練是唯一創造出防禦性的方法 — 例如通過不斷在專有產品資料上重新訓練。但它需要更高的資本需求和更不靈活的產品團隊。
- 建立功能 vs 應用程式。生成式人工智慧產品有許多不同的形式:桌面應用程式、行動應用程式、Figma/Photoshop 外掛程式、Chrome 擴充功能,甚至是 Discord 小工具。將人工智慧產品整合到用戶已經在使用的工作環境中是很容易的,因為 UI 通常只是一個文字框。這些可以成為獨立公司的選項是哪些?而哪些機會將把人工智慧整合到其產品線的現有公司,如 Microsoft 或 Google 所吞併?
- 管控熱潮周期。目前還不清楚生成式人工智慧產品的流失率是種正常狀況,還是早期市場的一種特徵。或者,對生成式人工智慧的興趣是否會隨著熱潮逐漸消退而減弱。這些問題對於應用程式公司具有重要的影響,包括什麼時候加速籌資;如何積極加大投資客戶獲取、優先考慮哪些用戶群、什麼時候宣布達成產品與市場契合(Product Market Fit)。
模型提供商發明了生成式人工智慧,但尚未達到大規模商業規模
當前的生成式人工智慧是由像Google、OpenAI 和 Stability 等公司的卓越研究工作而成。透過創新的模型架構和大規模訓練的努力,我們都可以享受到當前大型語言模型(LLMs)和圖像生成模型令人驚嘆的功能。
然而,這些公司的收入相對於用量和矚目程度仍然相對較小。在圖像生成方面,Stable Diffusion 已經看到社群的爆炸式成長,由使用者介面、托管服務和微調方法的生態系統支援,但是 Stability 以免費提供給大家作為他們生意的核心原則。在自然語言模型方面,OpenAI 占據了主導地位,推出了 GPT-3/3.5 和 ChatGPT。但是目前為止建立在 OpenAI 上的殺手級應用程式相對較少,且價格已經調降過一次。
這可能只是暫時性的現象。Stability 是一家新公司,尚未專注於賺取收益。OpenAI 具有成為龐大企業的潛力,隨著更多的殺手級應用程式的開發,有望獲得 NLP 類別收益的重要部分。特別是如果它們的整合順利進入 Microsoft 的產品組合中,則大規模的收益可能不遠。
但是也存在隱憂。作為開源程式碼的模型可以被任何人托管,包括不承擔大規模模型訓練成本(高達數百萬美元)的外部公司。而且,封閉程式碼模型是否能夠永久保持其優勢尚不清楚。例如,我們開始看到由Anthropic、Cohere和Character.ai等公司建立的LLMs接近OpenAI的性能,在類似數據(即網路)上進行訓練,並使用類似的模型架構。Stable Diffusion的例子表明,如果開源模型達到足夠的性能和社群支持,則專有替代品可能很難競爭。
到目前為止,對模型提供者而言,最明顯的結論是商業化可能與托管有關。對私有API(例如OpenAI)的需求正在快速成長。開源模型的托管服務(例如Hugging Face和Replicate)正在成為分享和整合模型的方便樞紐,甚至在模型生產商和消費者之間存在一些間接的網絡效應。也有一個強有力的假設,透過與企業客戶的微調和托管合約可以獲利。
除此之外,模型提供者面臨著一系列的重大問題:
- 商品化。有一種普遍的信念,即人工智慧模型的性能隨著時間的推移會逐漸趨向一致。與應用程式開發人員交談,很明顯這一點尚未實現,在文字和圖像模型中都有強有力的領導者。他們的優勢不基於獨特的模型架構,而是基於高資本要求、專有的產品互動數據和稀缺的人工智慧人才。這是否是一種持久的優勢?
- 脫離模型提供商的風險。依賴模型提供商是應用程式公司開始和甚至成長其生意的絕佳方法。但一旦達到規模,他們就有內部建立和/或托管自己模型的動機。模型提供商的客戶分佈非常不均,其中一些應用程式掌握大部分的收益。如果這些客戶切換到內部人工智慧開發,將會發生什麼事?
- 錢重要嗎?生成式人工智慧的承諾是如此巨大,也可能是如此有害,以至於許多模型提供商已組織成公益公司(B公司),發行有上限的利潤股份,或以其他方式明確納入公益的任務。這並沒有妨礙他們的募資工作。但是,我們有理由討論大多數模型提供商是否真正想要捕捉價值,以及他們是否應該這樣做。
得基礎設施得天下。
幾乎所有生成式人工智慧的東西都會在某一個時刻經過雲端執行的 GPU(或 TPU)。無論是由模型提供商/研究實驗室運行訓練工作、由托管公司運行推論/微調,還是由應用公司做一些結合,FLOPS (FLOPS 是 floating point operations per second 的縮寫,意思是每秒浮點運算次數,可理解為計算速度)都是生成式人工智慧的命脈。
因此,生成式人工智慧市場中的大部分錢最終都會流向基礎設施公司。大致估算一下:我們估計,應用程式公司平均將大約 20–40% 的收入花在推論和每個客戶的微調上。這通常直接向雲端提供商付款,以獲得運算結果,或者向第三方模型提供商付款 — — 他們又將大約一半的收入花在雲端基礎設施上。因此,今天生成式人工智慧的總收入中有 10–20% 可能流向雲端提供商。
除此之外,訓練自有模型的新創公司已經募了數十億美元資金,其中大部分(高達早期輪投資的80–90%)通常也會花在雲端提供商身上。許多上市科技公司每年在模型訓練上花費數億美元,不管是與外部雲端提供商或直接與硬體製造商合作。
這可以說是「技術上」的一大筆錢,尤其是對於一個新興市場來說。其中大部分被花在了三大雲端服務商上:亞馬遜網路服務 (AWS)、谷歌雲端平台 (GCP) 和微軟 Azure。這些雲端服務商每年共花費超過 $100 億美元的資本支出,以確保他們擁有最全面、可靠且成本競爭力的平台。尤其是在生成式人工智慧方面,他們也因為有優先取得稀缺的硬體(例如 Nvidia A100 和 H100 GPUs)而受益。
有趣的是,我們開始看到有競爭力的對手出現。像 Oracle 這樣的挑戰者已經通過大量的資本支出和銷售獎勵做出進展。一些像 Coreweave 和 Lambda Labs 的新創公司,已經在為大型模型開發商提供專注的解決方案而迅速成長,它們透過成本、可用性和客制化支援進行競爭。它們還提供更細部的資源抽象(如容器),而大型雲端服務提供的只是由於 GPU 虛擬化限制的服務。
我們認為,迄今為止生成式人工智慧的最大贏家,是負責運行絕大部分人工智慧工作的 Nvidia。Nvidia 在 2023 年第三季的數據中心 GPU 收入為 38 億美元,其中有很大一部分用於生成式人工智慧。他們透過多年對 GPU 架構的投資、堅實的軟體生態系統以及在學術界的深入使用,建立了強大的壁壘。最近的一項分析發現,Nvidia GPU 在研究論文中被引用的次數是頂尖人工智慧晶片新創公司加起來的 90 倍。
還有其他硬體選擇,包括Google Tensor Processing Units(TPU);AMD Instinct GPU;AWS Inferentia 和 Trainium 晶片;以及來自 Cerebras、Sambanova 和 Graphcore 等新創公司的人工智慧加速器。Intel 作為遲到者也進入了市場,推出高階 Habana 晶片和 Ponte Vecchio GPU。但到目前為止,這些新晶片中沒有幾個取得重要的市場份額。要注意的兩個例外,
- Google,其 TPU 在 Stable Diffusion 社群和一些大型 GCP 交易中獲得了關注
- 台積電,據信生產所有上述晶片,包括 Nvidia GPU(Intel 使用自己的製造商和台積電混合來製造其晶片)。
簡單來說,基礎設施是一層豐厚、耐久且似乎不易受攻擊的堆棧。
對於基礎設施公司來說,要回答的重要問題包括:
- 無狀態工作負載怎麼辦,這個意思就是說,無論你在哪裡租用 Nvidia GPU 都是一樣的。大多數人工智慧工作負載是無狀態的,即模型推理不需要附加資料庫或儲存(註釋:它不需要外部的資料庫,除了模型權重本身)。這意味著人工智慧工作可能比傳統的應用工作更容易在雲端遷移。在這種情況下,雲端供應商如何創造黏性,防止客戶跑到更便宜的選擇?
- 晶片要是不稀缺了怎麼辦?雲端提供商和 Nvidia 的定價,因為 GPU 稀缺供應而可以賣得很貴。有供應商告訴我們,A100 的上市價格自推出以來,已經持續上升,而這對電腦硬體來說是非常不尋常的。那麼,當這種供應限制最終透過增加生產和/或採用新的硬體平台而消除時,對雲端供應商有什麼影響?
- 新晉挑戰的雲端服務能否突破重圍?我們認為垂直雲端服務將以更專業的產品從三巨頭手中奪取市場份額。到目前為止,在人工智慧領域,新來的雲端服務選手,已經透過適度的技術差異化和 Nvidia 的支持,獲得了動力。比如說,現有的雲端供應商既是他們的最大客戶,也是新興的競爭對手。那麼,對這些新興雲端服務公司來說,長期的問題是,能否克服三大巨頭的規模優勢?
那麼,價值到底在哪部分會累積最多?
當然,我們還不知道。但是根據我們對生成式人工智慧的早期數據,以及對機器學習創業公司的經驗,我們的直覺如下:
在今天的生成式人工智慧中,幾乎不存在任何意義上的系統性護城河。我們看到目前的應用程式,產品差異化不大,這種跡象非常明顯。原因在於,這些應用使用的是類似的人工智慧模型。目前模型面臨的,是無法判斷它們在更長周期內的差異化到底在哪,它們是在類似的資料和架構上訓練的;而雲端服務供應商同樣有相同問題,大家的技術基本雷同,因為運行相同的 GPU;甚至硬體公司,也會在相同的工廠生產晶片。
當然,仍有標準護城河 — — 規模護城河存在,比如說同樣的創業公司,我比你更能募資,我的募資能力更強;或者供應鏈方面的護城河,我有 GPU,你沒有;或者是生態系統護城河,比如說我軟體的用戶比你多,且開始的早,我有時間和會員規模壁壘;再或者演算法護城河,比如說我的演算法就是比你更強大。銷售領域的護城河,我就是比你會賣,我是通路上的佼佼者;再或者就是數據的護城河,比如我收集的數據比你多。
但是,這些護城河都無法在長期上具備優勢,且不可持久。而且,目前要判斷強大的、直接的網路效應到底會在這些堆棧的那一層佔據優勢,目前還為時過早。
根據現有的數據,目前還無法判斷在生成式人工智慧領域,是否會出現長期贏家通吃的機會。
聽起來有些奇怪,但對我們來說,這是好消息。
正是因為整個市場的潛在規模難以把握,軟體和所有人的嘗試息息相關。我們預計會有很多參與這個市場的選手,大家會在生成式人工智慧堆棧的各個層面進行良性競爭。我們期望,橫向和縱向都能有成功的公司。
但是,這是由終端市場和使用者決定的。例如,如果終端產品的主要差異化在於人工智慧技術本身,那麼垂直化(即把面向使用者的應用程式與在地化模型緊密結合這塊)領域很可能會勝出。
而如果人工智慧是一個更大的、長尾的功能的一部分,那麼橫向化也許才是真正的趨勢。當然,隨著時間的推移,我們也應看到更多傳統的護城河的建立,甚至會出現一些全新的護城河。
無論怎樣,可以肯定的一點是,生成式人工智慧改變了行業。所有人都在持續學習,有大量的價值將被釋放出來,而科技生態將因此而改變。所有人都在努力的路上。