界面新聞記者 | 李彪
界面新聞編輯 | 文姝琪
2022年前后,在OpenAI還未發布ChatGPT前,“AI infra”(AI infrastucture)在業內還不是一個完全成型的概念。許多研究高性能計算、分布式系統、大規模算力網絡集群等技術的創業者都還處于“拿著錘子找釘子”狀態。
這一時期,基流科技創始人胡效赫從清華大學自動化系博士畢業,開始進入AI領域創業。在清華大學就讀本科與博士期間,胡效赫的研究方向是云計算、分布式系統和高性能網絡處理。他的創業團隊成員大多來自清華大學網絡安全實驗室。“在AI大模型火起來之前,我們在實驗室里研究分布式系統、云計算、云網絡等技術,產業界最主要需求還是與自動駕駛仿真有關。”胡效赫告訴界面新聞記者。
在GPT-3、GPT-4等AI大模型陸續問世并引發全球轟動后,AI infra近兩年成為了備受關注的熱門創業方向。按照業內通俗定義,AI infra是涉及人工智能底層基礎設施的產品與技術的統稱,包括硬件、軟件、數據和算法。基流科技主要研發通信網絡及配套的交換機硬件、算力調度運維軟件,用于支持AI大模型的算力集群落地與運營。IDC報告顯示,2024年上半年,全球在AI部署的計算和存儲硬件基礎設施上的支出達到474億美元,同比增長97%。
DeepSeek今年的出現進一步催化了AI infra的熱度。DeepSeek通過MOE架構(Mixture-of-Experts )與強化學習(Reinforcement Learning)一系列手段,針對人工模型底層基礎設施做優化,大幅降低了模型的訓練成本。
胡效赫認為,DeepSeek帶火AI infra的直接原因是行業看到了從底層優化AI模型效率的重要性。以公司所做的算力網絡舉例,“2024年行業門檻開始變低,但其實很多廠商就是把服務器和網絡的線插上連上,完成基本的硬件集成工作,就算做完了組網。Deepseek出現后,業內開始認識到,要真正降低成本,達到一定的利用率,像是把原來需要4000張GPU卡做的訓練變成3000張,就需要深入基礎設施底層,通過關鍵技術創新去優化計算通信效率。”
此前,算力一直被認為是限制AI模型性能的瓶頸,各地都在大舉投建新的AI數據中心用于算力擴容。在DeepSeek出現并降低了AI模型研發的算力門檻后,業內開始討論前兩年快速擴張的算力需求是否會放緩,市場是否存在泡沫——全球算力霸主英偉達年初也受DeepSeek沖擊,股價縮水超過了20%。
胡效赫認為,DeepSeek出現后市場接下來對算力依然保持強需求。在他看來,DeepSeek V3 是迭代訓練的結果,涉及大量反復嘗試與重試,過程中仍然需要消耗不少算力。算力需求與迭代兩者間的基本邏輯依然是“投入更多算力,就能更快看到迭代的效果”。
“用業內經常提到的一個例子打比方,一個人中午吃飯要吃10個包子。不可能最后反過來說前面9個包子都不重要,只吃第10個包子就能飽。”胡效赫說。
此外,市場熱議的另一種觀點認為,DeepSeek出現后,市場對算力的需求非但不會降低,反而會大幅上升。
行業原先認為,從無到有地生成一個大模型主要依靠“訓練”,用訓練好的模型處理新數據主要依靠“推理”。模型前期訓練需要“喂”海量的數據,數據計算過程需要消耗更多的算力,算力需求主要集中于模型訓練。業內IDC等市場機構曾估算,訓練算力與推理算力在2023年的比例是8比2,但未來隨著模型成熟、性能趨于穩定,推理算力需求將有更快的提升。
而DeepSeek的出現加速了這一趨勢。DeepSeek的突破被認為是模型推理的技術創新,其開源模型的推廣將一步推動基于AI推理的應用開發。行業最新預測,訓練算力與推理算力的比例很快將達到6比4,甚至更高。英偉達CEO黃仁勛此前在媒體采訪與3月的GTC大會上多次強調,隨著行業原先集中于訓練的算力向推理遷移,算力需求的總量不降反升。“DeepSeek的成功反而證明了市場需要更多芯片”。
隨著算力需求的持續擴容,AI infra行業也將迎來更大的增長機遇。自2023年公司成立以來,基流科技已經參與過搭建萬卡集群,支持了國內十多個智算數據中心集群落地,服務過包括智譜AI、商湯、運營商、地方國企等一眾客戶。此前接受媒體采訪時,胡效赫曾提到,基流科技的算力集群方案在生產環境中達到全球一線廠商的利用率水平,同時幫助客戶在千卡落地中節省成本上千萬元,在萬卡落地中節省數億元。
最早作為國內早期創業孵化機構奇績創壇的項目,基流科技目前為止已完成了天使輪到A輪的五輪融資,背后投資方有智譜、光速光合、華泰創新、招商局創投、中關村科學城、張江高科、水木清華校友基金、卓源亞洲、啟迪之星、國方創新等一眾機構。據界面新聞了解,公司近期即將完成新一輪融資。一位投資人告訴記者,基流科技去年營收已經破億。
創業之初,胡效赫對公司的定位是做“大模型時代的思科”。思科曾在互聯網產業崛起的過程中靠提供大量的網絡交換機、路由器設備,參與構建了全球網絡基礎設施,基流科技則要在數據中心、國產通信網絡系統、高性能計算集群等AI基礎設施上發力。同時在此過程中,公司還計劃投入更多的研發創新和商業化推廣,建設國產供應鏈以實現國產化替代目標。
當前,大火的AI infra賽道也已經涌入了更多公司。胡效赫認為,雖然各家切入創業的方向不同,技術與產品也有很大的差異,但隨著資本的涌入,競爭加速,整個AI infra領域與兩年前相比發生了根本變化,“如果說2022年、2023年,AI infra的創業者還可以僅靠團隊背景、技術拿融資,現在已經到了要講商業化、講實際業務規模的階段。”