• BETVLCTOR伟德官方网站
  • 經管郵箱
  • 教職工内網
  • 用戶登錄
  • EN

生成式AI産業發展的前途與挑戰

2024-04-15
閱讀:

生成式AI産業發展的前途與挑戰

 

本文綜合未來主義和現實主義的雙重視角考察方興未艾的生成式AI産業。一方面,着眼未來,把生成式AI置于數字化浪潮推進的曆史中,預判其作為大智能時代基礎設施的戰略意義;另一方面,立足現實,分析生成式AI産業生态的供給側、需求側及區域條件三大維度,指出中國生成式AI産業發展面臨的結構性問題。最後,提出三條政策啟示。

 

/ 侯宏

 

生成式AI推動大數據時代向大智能時代躍遷

産業觀察家們注意到生成式AI的革命性意義,并作出豐富解讀。英偉達創始人兼首席執行官黃仁勳稱生成式AI的推出為“AI産業的iPhone時刻,意指其颠覆性的技術突破和産品形态或将引發Al産業的全面變革。投資公司a16z的合夥人馬丁·卡薩多(Martin Casado)則稱其為第三個計算時代,意指繼微芯片将計算的邊際成本降到零、互聯網将分發的邊際成本降到零之後,大模型将創作内容的邊際成本降到零的第三次飛躍。麥肯錫技術合夥人萊瑞拉·餘(Lareina Yee)則将其類比為計算産業經曆過的大型機到PC的劇變,意指生成式AI将技術使用權從精英轉向大衆,實現了AI技術的民主化。然而,以上解讀局限于AI産業自身,沒有考慮生成式AI如何重塑更廣泛的經濟。筆者認為,生成式AI和大模型有潛力成為整個國民經濟智能基礎設施,進而奠定所謂的大智能時代。

生成式AI,有何不同

不同于專注解釋現有數據的分析式AI或根據給定輸入推斷輸出的預測式AI,生成式AI專注于生成新内容,或稱合成數據(synthetic data)。ChatGPT僅是大模型的一種,準确地說,它僅是文本大模型的一種。文本大模型之外,還有音頻大模型和視覺大模型。最近,大模型已發展至具備多模态對話能力。

不同于預設規則或者試圖尋找結構化規則的傳統AI,生成式AI直接從海量未經标簽化的非結構化數據中提取基礎模型(foundation model)。由于基礎模型的參數巨大,常被稱為大模型。大模型的訓練極端昂貴,但具備一系列傳統AI模型不具備的優勢:一是其采取的非監督訓練的方式極大地降低了人工标注的需要;二是模型具有更好的通用性,可靈活應對多種任務;三是大模型可以理解并使用人類語言,交互體驗非常自然。

歸根到底,大模型是人類全量知識的壓縮。傳統AI利用有限的知識(預設的算法)從豐富的場景數據中提取結果,而大模型利用近乎完備的知識去解讀場景數據(盡管它不一定豐富)。

大模型作為智能基礎設施

生産力的進步通常體現為某種新型基礎設施的建立。工業時代出現電力基礎設施,網絡化時代出現網絡基礎設施,而智能時代将出現何種基礎設施?筆者斷言大模型具備成為智能基礎設施的潛力,因其具備基礎設施的三個基本特征。

一是通用性。傳統AI需要針對特定任務設計,表現出更多的專用性與垂直性。相比之下,經過高強度預訓練的大模型具備靈活應對多種非預設任務的能力,可通過微調及提示詞工程實現應用情景的高擴展,進而在通用性上大大提升。

二是規模經濟。大模型的規模經濟與兩個概念有關。一是智能湧現。隻有模型參數規模超越臨界點之後,智能才開始湧現。工業經濟情景下,低于最小有效生産規模的廠商無法有效參與市場競争。類似地,廠商必須投入高昂的前期訓練成本,才能參與大模型市場競争。二是智能摩爾定律。傳統摩爾定律預測矽片上的晶體管密度随時間推移指數級增長,而成本保持不變。智能摩爾定律則預測大模型智能所能覆蓋的場景數(智能密度)具有類似的規律。這意味着,随着大模型參數的增長,其覆蓋智能場景的單位成本呈指數級降低。

三是外部性。修好的路上不跑車,價值等于零。盡管大模型語境下的是什麼尚未完全确定,但确定的是大模型的出現将促進各類車型的創新。因此,大模型對經濟的推動作用要遠遠大于生成式AI産業産值本身。聊天類應用僅僅是大模型應用的初級形态,創意和想象力與未知場景結合迸發出的産業能量,才是大模型作為基礎設施最具想象空間之處。

通用性、規模經濟和外部性是基礎設施的一般性特征。那麼,大模型作為智能基礎設施的特殊性何在?筆者認為,這是人類曆史上第一次實現智能的大規模集中供給,故而稱其為智能基礎設施。難道數字化時代不是已見證林林總總的智能化基礎設施嗎(如智能手機、智能電網、智能交通等)?此處需澄清,智能的基礎設施化不同于基礎設施的智能化。智能手機的核心是手機,智能電網的核心是電網,智能交通的核心是交通,賦予其各種智能内涵的過程是基礎設施的智能化。智能基礎設施的核心則是相對通用的智能本身,能對接千行百業。過去幾十年,數字化基礎設施圍繞信息的采集、處理、傳輸、存儲、計算等環節得到充分發展,而智能基礎設施的發展才剛剛開始。

從大數據時代到大智能時代

每輪基礎設施躍遷都會引發一輪新商業機遇。這是因為,基礎設施将此前需要分散承擔的可變成本轉化為集中承擔的固定成本,推動新要素普及、降低創新門檻。智能基礎設施帶來的新要素就是智能:大模型壓縮了人類所有知識,将場景數據輸入大模型,大模型就能根據其知識反饋相應結果。當這種智能産生模式廣泛應用,我們或将見證前所未有的大智能時代。

筆者認為,大智能時代區别于大數據時代的核心特征是數據與智能的解耦。谷歌常因所謂數據網絡效應被反壟斷機構約談:搜索引擎的市場份額越大,用戶數據就越多,數據訓練出來的機器算法也就越智能,用戶體驗進一步提升,進而獲取更大的市場份額。曾鳴教授更是基于阿裡巴巴的類似經驗,提煉出以數據智能為基石的智能商業方法論。這種思維強調企業構建的數據飛輪是智能商業的前提:無數據,不智能。

在大智能時代,這一圭臬在産業層面仍然成立,但在企業層面的應用卻值得推敲:智能不再完全來自于企業自身構建的數據飛輪。數據作為智能原料的地位無可撼動,然而,大模型使用這種原料的效率遠超過此前分散部署的小模型,以至于有志于智能商業的企業構建自身數據飛輪喪失經濟性。國家電網能穩定輸出電力時,為何要在工廠旁邊自建小發電廠呢?

智能基礎設施化的後果之一是數據與智能的解耦(見圖1)。數據與智能的解耦并不意味着數據不重要,而意味着小數據也可以撬動大智能。當前,大模型的進一步發展面臨高質量數據源不足的障礙,可見數據的重要性。但這不意味着任何企業都需要花心思囤積數據。過去,企業要精心構建并維護一個數據供應鍊,才有可能實現所謂的數據智能。而今,大模型使得智能不需要在低水平重複開發。企業隻需要用小數據去微調這個模型,便有可能開展智能商業。由此,企業可節省精力聚焦業務創新,釋放出所謂——智能紅利。

 

圖片

 

生成式AI産業生态的三大維度

立足當下,本部分嘗試從三個視角來把握高度動态複雜的生成式AI産業生态。一是供給側視角的技術生态,有助于理解生成式AI技術實現所需的生産要素;二是需求側視角的應用生态,有助于了解生成式AI的應用方向;三是中美競争背景下的區域生态,有助于理解需求側和供給側在不同條件下的互動模式。

生成式AI技術生态

大模型技術生态符合典型的IT垂直分工架構。最底層是基礎設施,負責提供大模型訓練以及推理所需的算力。産業初期,算力主要用于模型預訓練。随着各大模型紛紛商用,用于響應用戶請求所需的推理算力占比快速增加。衆所周知,大模型的算力需求主要由GPU(圖像處理單元)來滿足,NPU(神經網絡處理器)和TPU(張量處理器)等專為大模型推理運算設計的芯片也逐步成熟。NPU主要用于手機、無人機等終端産品的計算單元,TPU是谷歌設計的雲計算芯片。值得注意的是,硬件集群隻是基礎設施的一部分,負責硬件資源調度的雲平台也非常重要。

基礎設施之上是大模型。大模型有開源和閉源之分。Open AIGPT是一個閉源模型,而20237月,MetaLlama II宣布支持開源和商用,引爆了大模型領域的開源運動。選擇開源模型還是閉源模型,似乎和應用有關。chatGPTMidjourney等廣受歡迎的面向消費(2C)領域的應用都構建在私有大模型之上。但面向企業(2B)領域的應用通常構建在開源大模型之上,因為開源大模型支持私有化部署,并在微調方面提供了更大的靈活度。

值得指出的是,大模型層與應用層之間存在一個中間層,旨在幫助應用開發者解決兩方面問題。一方面,基于大模型做二次開發 (微調、提示詞工程或基于人工反饋的增強學習)需要一系列工具或模闆;另一方面,由于市面上存在多種大模型,應用開發者可能希望一站式接入和管理。所謂MaaS(模型即服務)集成了這些工具和功能。

大模型應用生态

技術生态主要是巨頭和工程師的場域,應用生态則是創業者和産品經理的沃土。在技術生态部分,應用層在技術堆棧中的位置得到了強調。本部分談及的應用生态從需求側視角展開,根本上是要回答大模型如何對接應用場景、創造用戶價值。這個問題可以沿着兩個維度思考:客戶屬性和産品策略。

一方面,2C領域和2B領域的大模型應用在價值創造方面具有顯著差異。首先,消費類應用的價值創造幾乎都在應用内完成,而企業級應用需要與企業内部價值鍊和IT系統整合。其次,消費類應用幾乎都基于公有雲,而企業客戶因隐私顧慮偏好私有雲或混合雲部署。最後,消費類應用通常以一對多的方式提供服務進而迅速規模化,而企業級應用服務通常需要一對一定制。以上2C2B客戶市場的一般性差異,并不因大模型技術的開創性而改變。可見,2C應用的價值創造具備獨立性,而2B應用的價值創造高度依賴其他互補性資源。進而,2C應用有望構建出一個以自身為中心的生态,而2B應用通常嵌入在位玩家(包括客戶)的生态中。

另一方面,無論是2B還是2C,大模型應用可考慮增強、替代或整合三種策略。增強策略為現有産品或服務加入大模型性能,進一步提升産品體驗。比如,Office産品中嵌入了基于大模型輔助工具(Copilot)或者視頻遊戲中引入大模型生成個性化劇情。替代策略則把大模型應用作為生産力工具替代原有的低效流程。比如,在客服行業,替代正在大規模發生,一部分營銷設計工作也有望在大模型的支撐下實現自動化。相較于增強現有産品和替代低效流程,整合策略跳出了現有産品或流程,重新定義客戶體驗。筆者避免使用颠覆一詞,因為這種重新定義很大程度上是基于重組現有要素發生的。大模型并不創造要素,但提供了高超的整合能力(如通過智能體即Agent進行整合)。

上述兩個相對獨立的維度可以構建出一個2X3的矩陣。這個矩陣中的一些格子看起來比另外一些格子更令人興奮。但一個機會令人興奮的程度,通常與其進入門檻成正比,與最終勝出的概率成反比。最終,這個矩陣會被具有不同資源禀賦和風險偏好的創新者(或創新采納者)所填滿,構成一個複雜而多元的大模型應用生态。

生成式AI的區域生态

業不可避免地嵌入在區域中。縱觀全球,生成式AI的産業競争主要在中美之間開展。對于中美AI産業的一般性對比分析不是本文的重點。本文主要關注的是兩國區域條件的差異如何影響技術生态、應用生态以及兩者之間的良性反饋。

靜态對比,中美兩國在技術生态方面的差距并不緻命。誠然,美國在聚集、培養生成式AI技術人才方面具有顯著優勢。并且,GPU出口管制在很大程度上也增加了中國企業的成本,但同時要看到我國有三個方面的有利因素。第一,得益于開源運動的知識溢出效應,中美技術差距并沒有大到足以阻礙中國的産業進步;第二,中國企業對開源的貢獻也日益顯著,中國也吸引了一些頂級科學家回國創業;第三,盲目的科技軍備競賽并不可取,大模型産業競争的焦點已轉向工程化和商業化。

令人擔憂的反倒是中美應用生态的差距。高科技産業的發展,短期内可以靠資本維系,長期則需要靠市場來支付發展所需的成本,包括消費者側和企業側的支付。然而,中國消費者的付費能力遠不如美國消費者。中國移動通信用戶的月均支出約為50元,美國約為50美元,但中國企業購買GPU的成本要高于美國企業。在2B市場,先不論支付能力,中國企業數字化水平低首先就是一個大問題,尤其體現在SaaS(軟件即服務)的低滲透率上。大模型應用更容易部署到SaaS化程度較高的企業,因其底層數據治理較規範,流程标準化程度較高。SaaS化程度不高的企業需花費大量時間、精力和資源去做前期準備,這會導緻大部分企業淺嘗辄止或望而卻步。

值得強調的是,中國在移動互聯網時代的場景優勢在生成式AI産業是不成立的。場景優勢建立在疊代之上,而疊代的前提是發展用戶。縱觀所有國内大模型企業,沒有一家像推廣移動互聯網應用程序那樣去不遺餘力發展用戶。關鍵原因在于,移動互聯網應用程序服務一個新用戶的邊際成本幾乎為零,而大模型應用發展一個用戶的邊際成本恒不為零。在商業模式清晰之前,地主家也沒餘糧這麼燒。

如果說中國移動互聯網的成功經驗之一在于前端場景優勢與後端技術進步的正反饋,筆者擔心中國生成式AI産業正在經曆一個截然相反的過程。從這個動态視角再去看待中美之間技術生态的差距,恐怕會得到與靜态對比不同的結論。

幾點思考與建議

據說,人們容易高估一件事的短期影響但低估其長期潛力。關于生成式AI産業,本文的觀點恰好相反:筆者長期看好其作為智能基礎設施的前途,但短期内對其結構性障礙持悲觀态度。前文沒有論述中美生成式AI産業發展面臨的共性挑戰,而是聚焦中國相對于美國的比較劣勢。那麼,中國有沒有比較優勢呢?筆者相信,發揮以下三方面的比較優勢或有助于彌補劣勢:移動互聯網生态、産業協同治理和商業模式創新。

一是打通移動互聯網生态與生成式AI産業生态。我國移動互聯網産業在網絡、終端與應用環節具備端到端的競争優勢,有望加持孱弱的2C生成式AI應用生态。比如,微信生态如何引入生成式AI、國産手機操作系統如何與生成式AI融合、雲網一體如何助力AI算力網絡效率提升等議題都應沿着如何利用業已建立的比較優勢去哺育生成式AI産業的思路去思考。

二是推動智能産業群協同發展。智能基礎設施的建設需要整合算法、算力和數據等要素,是數字基礎設施和數字資源體系的有機融合和升級。支持數字基礎設施運營企業向智能基礎設施運營企業升級,實施算力、數據、算法的一體化運營。在需求側,通過降低各行業使用生成式AI的成本,拉動應用、工程、運營等配套服務的發展。

三是堅定鼓勵商業模式創新。生成式AI産業面臨的問題歸根到底是價值創造和價值分配的問題,即商業模式。無論是打通移動互聯網生态還是推動産業協同發展,都旨在為生成式AI生态的發展創造一個更廣闊的環境和更堅實的基礎。這些比較優勢能否有效轉化并彌補上述比較劣勢,商業模式起決定性作用。

 

侯宏:北京大學國家發展研究院 管理學助理教授

 

責任編輯:劉永選

來源:《清華管理評論》20244月刊

 

Baidu
sogou