記者 | 佘曉晨
作為“東數西算”的代表性城市之一,烏蘭察布又多了小鵬汽車這位“新朋友”。
近日,小鵬汽車宣布在內蒙古烏蘭察布建成中國最大的自動駕駛智算中心“扶搖”,用于自動駕駛模型訓練。
“智算”指的是智能計算,是一種專用于機器學習的算力形式。據工信部統計,目前中國已有20多座智算中心,包括谷歌、微軟、Meta、特斯拉、阿里在內的科技公司都已建造智算中心。而對于自動駕駛行業來說,數據訓練至關重要,算力的挑戰也在加劇。
成本和效率或是此次合作中強調的關鍵詞。
小鵬汽車董事長、CEO何小鵬向媒體表示,隨著自動駕駛模擬訓練的需求變化,他們需要一個強大的本地+云端的算力以支持訓練。“去年初我們就判斷,2025年之后小鵬的算力每年花費可能會超過10個億,因此要思考如何把算力不斷提高,控制好成本,把技術鋪墊做好?!焙涡※i說。
據小鵬汽車方面介紹,“扶搖”對GPU資源進行細粒度切分、調度,將GPU資源虛擬化利用率提高3倍,支持更多人同時在線開發,效率提升十倍以上。此外,“扶搖”采用風冷、AI調溫、模塊化設計等綠色技術,年平均PUE(數據中心能耗電力電源使用效率)低于1.2——目前國內企業數據中心的PUE平均值為1.5左右。
之所以實現上述效果,不得不提到烏蘭察布的地理和氣候優勢。
烏蘭察布的冷涼氣候可以極大地降低制冷消耗的電力,而這部分電力在大數據中心服務器電力消耗中占據較大比重,多達40%。同時,烏蘭察布市數據中心可享受0.26元/度的電價,幾乎是全國最優惠。除了阿里巴巴,蘋果、華為、騰訊等12大數據中心都已落戶烏蘭察布。
從最直觀的效果來看,“扶搖”建成后,自動駕駛模型訓練的速度將大幅提升。以小鵬的一個核心模型為例,過去需要7天才能完成一次訓練,但算力規模達600PFLOPS(每秒浮點運算60億億次)的“扶搖”可讓訓練時間縮短至不到1小時,提速了近170倍。據了解,目前“扶搖”正用于小鵬城市NGP輔助駕駛系統的算法模型訓練。
盡管阿里云此前已在烏蘭察布建立數據中心,但此次和小鵬汽車合建的“扶搖”采用公有云專屬集群模式,是兩家公司在汽車領域的首次應用嘗試。
阿里云智能解決方案銷售部總經理霍嘉稱,之所以選擇這樣的模式,一方面是出于小鵬汽車對算力的優化要求,另一方面也是為了保留未來利用云計算大基礎設施的彈性。
何小鵬則表示,小鵬汽車在“扶搖”中建立了三套數據閉環,跟原來的純算力平臺相比,智算中心的耦合更深。并且,除了算力、電力、存儲力這些平臺上的技術,雙方還在軟件層面進行更多合作。
霍嘉透露稱,阿里云和小鵬汽車的確是基于計算存儲網絡開始合作,但從去年下半年開始,他們已經在人工智能平臺、數字工廠等領域推進合作;“扶搖”項目也是從2021年開始推進。
今年2月17日,國家發改委、中央網信辦、工業和信息化部、國家能源局聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群。乘著“東數西算”的東風,云計算公司將更多目光投注到西部地區。
阿里云從2020年就開始和烏蘭察布合作,計劃在當地投資100個億。在和小鵬汽車合作之后,阿里云打造行業標桿案例的意圖也很明顯。但在建成基礎設施之后,數據中心的上架率和使用率將是影響后續發展的重要因素。如何吸引更多企業和行業進行“西算”,為他們提供合適的云服務方案,是頭部云計算公司共同面臨的挑戰。