文|新摘商業評論 南溟
華為終于又透露了大模型的消息。
大模型新產品將于今年7月初發布,據了解,這款大模型產品是一款多模態千億級大模型產品,其客戶主要面向To B/G政企端客戶。
這也讓華為在大模型領域的野心逐漸擺上臺面。
天眼查搜索發現,華為申請注冊了兩枚“HUAWEI NETGPT”商標,國際分類為科學儀器、網站服務,當前商標狀態為申請中。更有意思的是,華為已成功注冊多枚“盤古”“PANGU”商標。
華為向媒體表示了,最新的大模型不會有“盤古Chat”此類命名,也不“對標”業界產品。
一系列的大動作讓華為在大模型領域的布局從幕后走到了臺前,面對國內大模型領域火熱開賽,阿里,百度,科大訊飛,360等大廠已領先一步參與其中。相比之下,華為攜此前多次提到的盤古亮相,背后也并非一日之功,從云計算技術,到產業鏈支持,華為參與大模型競爭,也有其自身優勢。
華為躍躍欲試大模型
華為大模型最早于2020年11月在華為云內部立項成功,2021年4月對外發布,2022年4月,其升級到2.0版本,目前,AI 大模型中的 NLP 大模型、CV 大模型以及科學計算大模型(氣象大模型)均已被標記為即將上線狀態。
對于華為盤古大模型,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
據了解,華為盤古大模型是首個千億參數中文預訓練大模型,CV 大模型則首次達到 30 億參數。盤古 CV 大模型業界最大 CV 大模型、首次實現兼顧判別與生成能力、在 ImageNet 上小樣本學習能力上的業界第一。
CV大模型是指用于計算機視覺任務的大型深度學習模型,通常采用卷積神經網絡(Convolutional Neural Network,CNN)等深度學習算法來實現。
CV大模型的思路是將輸入圖像轉換為輸出結果,例如識別圖像中的物體類別或位置等信息。
近年來,隨著深度學習技術的發展和計算能力的提升,CV大模型在計算機視覺領域取得了很多重要成果,例如圖像分類、目標檢測、圖像分割等任務。
據華為云官方發布的消息,目前華為“盤古系列 AI 大模型”基礎層主要包括 NLP 大模型、CV 大模型、以及科學計算大模型等,上層則是與合作伙伴開發的華為行業大模型。
群雄逐鹿大模型云計算為AIGC開路
隨著去年ChatGPT的出現,大模型對科技社會的顛覆意義讓整個社會陷入“AI焦慮”,焦慮之余,隨之而來的,是國內各家大廠紛紛加入大模型戰隊,與其焦慮不如先人一步加入其中。
百度,阿里巴巴,科大訊飛等多家大廠都相繼發布了自己的大模型,而云作為最前端可以售賣的TOB產品,顯得更為直接。
在百度文心一言發布兩個多月之后,5月29日,李彥宏宣布百度很快會正式推出文心一言(ERNIE Bot)大模型3.5版本。與此同時,百度還宣布將設立規模為10億元的文心投資基金,面向AIGC領域潛力股創企,提供涵蓋資金、技術、業務資源在內的全面扶持,持續關注AI領域優質創業團隊。
李彥宏在演講中表達了對中國大模型領域發展前景的看法,在他看來:“未來將產生三大產業機會,分別為新型云計算公司、進行行業模型精調的公司,以及基于大模型底座進行應用開發的公司,即應用服務提供商?!?/p>
5月6日,科大訊飛正式對外發布訊飛星火認知大模型。科大訊飛董事長劉慶峰提出未來五年奮斗目標:達到十億用戶、實現千億收入、帶動萬億產業生態。
阿里巴巴的通義千問同樣來勢兇猛,不到兩個月的時間,阿里云已經對外發布了通義千問和通義聽悟大模型,在自然語言生成和AI音視頻賽道火速布局,此外像天貓精靈和釘釘應用層面的產品也紛紛通過云的底層來實現更好地運轉。
大廠動態頻頻,大模型背后依靠的,是算力,算法和數據的支持,這一切,最終都要歸功于大廠云計算的實力。顯然,目前百度,阿里大模型都在為云計算鋪路。
大廠逐鹿大模型時代下,對云計算提出了更多元的要求,云計算的技術架構以及產品布局也會隨著各家大廠大模型產品的調整而進行相應的適配和改變。
同樣大模型的熱點,也為云計算TOB帶來了流量和關注點,讓原本沒有那么性感的產品讓外界有了更深的認識。
AIGC的發展需要海量的數據資源做支撐,大模型算力需求的算力底座計算資源,網絡連接,數據存儲以及模型管理需求等,都需要云計算做支持。
以ChatGPT為例,其發布后一度引來巨量訪問,使得其多次出現宕機,這足以見得,大模型對于穩定性的需求之高。從算力上來看,云計算能夠借助通用服務器和專屬硬件為大模型提供更優化的計算資源的調度和管理,以保證良好的運力穩定性。
縱觀國內已經入局大模型的大廠,無一不是在云計算領域有著超前技術優勢的企業。
攜盤古入場華為新大模型亮點何在
對于中國的大模型,李彥宏認為,中國會有自己的生態系統,擁有自己的大語言模型和基礎模型。中國會出現至少一個、也可能是兩個或三個基礎大模型,可以支持人們開發各種AI原生應用。
基礎大模型是基于更廣泛更全面生態系統的支持上的,需要強大的數據和算力支持。
這一點,華為大模型也有其獨特的優勢。
據華為云官方數據,目前,華為云AI已在各行業落地了1000+項目,在大模型方面,華為云的AI技術多元化項目提供海量數據支持,同時,華為云自身有多年的市場積累,在用戶群體的拓展,市場應用方面具備深厚的積淀。
從技術層面來看,華為沖擊大模型的優勢同樣突出,據了解,華為盤古大模型涉及千億參數,為此,華為團隊調用了超過2000塊的昇騰910,花費2個月時間訓練。昇騰 910是業界算力最強的AI處理器,基于自研華為達芬奇架構3D Cube技術,實現業界最佳AI性能與能效。
在產業鏈建設方面,華為投入大量的財力,以及技術支持,2022年,華為研發投入1615億元,約占全年收入的25.1%,管理層表示研發投資是華為構建長期、持續競爭力的核心。
此前,華為宣布實現自主可控的 MetaERP 研發,并完成對舊ERP系統的替換。6月5日,有消息稱,華為將于6月7日推出全新GaussDB數據庫產品,是國內首個軟硬協同全棧自主的數據庫。
華為常務董事、華為云CEO張平安曾表示:“人工智能正對所有行業產生深遠的影響,我們認為,AI大模型將會重塑各個行業的數字化轉型和智能升級?!?/p>
華為盤古大模型的問世和發展,勢必會給整個帶來新的血液,與此同時,華為想要在大模型領域占得領先之地,還需要華為云在技術、人員、財力等多方面源源不斷的貢獻力量。