簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

華為云All in盤古大模型,回應業界五大疑惑

掃一掃下載界面新聞APP

華為云All in盤古大模型,回應業界五大疑惑

在BATH等科技大廠中,華為是最晚官宣大模型進展的巨頭,并選擇了一條與OpenAI不同的道路。華為背后到底是怎么思考的?

文|數智前線  趙艷秋

編輯|石兆

7月7日下午,華為云在東莞舉辦的華為開發者大會2023(HDC.Cloud 2023 ) 上,宣布推出盤古大模型3.0,這是華為云自2021年4月正式發布盤古大模型后的最新進展。

由于華為是BATH等科技大廠中,最晚官宣大模型進展的企業,又選擇了一條與OpenAI不同的道路——定位產業、大模型包含三層架構、多個模型。由此,華為的路線選擇、大模型在行業市場的可商用性、華為發力點等,都引發業界廣泛關注。

01、為什么不是一個大模型?

與OpenAI聚焦于GPT一個大模型不同,華為云盤古大模型3.0包含了三層架構、多個模型。為什么華為大模型與OpenAI的不一樣?

在大會上,華為常務董事、華為云CEO張平安系統介紹了華為云盤古大模型的情況。華為云于2019年投入AI大模型研發,并于2021年發布了基于Transformer架構的盤古NLP中文大模型和阿語大模型。華為云稱,與2021年發布的盤古大模型 1.0相比,此次主要在架構、訓練方法上進行了升級。

在華為云盤古大模型3.0架構中,第一層L0層有5個盤古基礎大模型,不僅有今年最火的自然語言大模型,還有視覺大模型、多模態大模型、預測大模型、科學計算大模型。第二層L1層目前有多個行業大模型,既有基于行業公開數據訓練的行業通用大模型,如政務、金融、氣象等,也有基于行業客戶自有數據,在盤古L0和L1上訓練而來的企業專有大模型。第三層L2層是針對更多細化場景的模型,可以開箱即用。

為什么華為云會選擇這樣的道路?實際上,此前也有企業采用類似做法,“本質上是更容易實現行業閉環落地”,有業界人士認為,這是一個更平滑的技術路線。通過不同層模型間的飛輪效應,既可以把模型越做越大,也可以形成真實的行業落地和用戶反饋閉環,讓模型越來越有用,“而不是一上來就是萬億參數的大模型,卻形不成用戶反饋閉環”。

這輪大模型變革以語言大模型為主,但有人士注意到,從華為云基礎大模型來看,除了語言大模型之外,還有預測、科學計算大模型這類比較專用、解決特定問題的模型。業界人士告訴數智前線,這些基礎大模型之間能形成互補,也是目前演進的一個趨勢——這一輪以語言大模型發起,逐步衍生出CV、多模態等大模型。張平安介紹,他們是考慮到行業客戶不同應用場景、不同時延、不同響應速度的多樣化需求而來。

值得注意的是,盤古大模型采用了“完全的分層解耦設計”,這是盤古3.0全新做的架構設計,也是此前各大企業推出大模型時未涉及的。根據張平安的介紹,這是為了更好地構筑一個商業模式——適配行業不同場景,必須要做到完全解耦。比如,有些企業只需要圖像分析,不需要文案生成,基礎大模型和能力集解耦后,他們就可以按需調用;甚至還有數據解耦,模型升級時,數據就可以復用;這個解耦架構,也實現了模型的并行迭代。

02、為什么做行業大模型?

業界觀察,自從OpenAI推出ChatGPT之后,美國絕大部分創新應用集中在C端。在中國市場,百度、阿里、商湯、科大訊飛、華為等科技大廠先后公布大模型最新進展。截至7月,全球已發布數百個大模型,中國有80多個。

業界觀察,國內企業在大模型落地時,都結合自身在已有業務上的積累,雖然有些模型看著較為類似,但落地思路上有較大差異。比如,百度“文心一言”大語言模型,正在搜索、地圖、音箱等方向上探索;同時也推出“文心千帆”大模型平臺,爭奪產業級市場。科大訊飛一面將大模型技術疊加到教育、辦公智能硬件等成熟業務中,另一面也介入此前一直在做的醫療、教育等企業數字化市場。

華為云此次發布的盤古大模型3.0,則聚焦在行業市場,這也有賴于它在政企市場上的長期積累。張平安稱,“AI for Industries”是華為云堅持的方向,“盤古大模型,不作詩只做事”,這在一定程度上代表了產業界的聲音。資深業界人士認為,ChatGPT核心并不是“Chat”,而是它的思維鏈、智能涌現、從感知到認知這些巨大的變化,它讓人工智能的通用性有了眉目,而不像過去一個場景、一個場景地去提供AI技術。

實際上,雖然這一輪大模型是先在消費級市場引發風潮,讓每個人意識到大模型的價值,但業界也達成共識,大模型是可能引發類似蒸汽機產業革命的技術范式變遷,因此,企業級市場也是商業競爭焦點。

張平安告訴數智前線,他們注意到OpenAI也有動作準備進入行業,“我覺得這才是正確的道路”。

03、大模型在行業是否達到可商用?

雖然業界在進軍行業,但由于目前大模型在企業級市場落地還處于早期階段,各種問題也引發了“大模型遠未達到可商用化程度”的說法。不過,從本次華為開發者大會上看,大模型落地的各種問題正在逐步解決,在產業中確實在發揮出價值。

舉例來說,大模型的最大弊端之一是擅于“一本正經地胡說八道”,這對于嚴謹的行業應用是致命的。而這次華為云演示了對準確性要求嚴苛的金融業和制造業的落地進展。

在金融行業,工行在全國有4萬多個網點、20多萬網點的柜員,經常要幫助客戶解決各種問題,需要在不同系統中進行多次查詢。工行和華為正在緊密合作,通過盤古打造工行的金融大模型。

華為云EI服務產品部部長尤鵬介紹,在合作中工行首先提出,大模型協助網點員工辦理業務時,第一要做到合規,這就意味著在用生成式大模型時,必須要能夠溯源。第二是要準確,年利率如果是3%,絕對不能說成3.5%。由此,基于盤古大模型的的銀行網點助手,將大模型的生成能力和檢索能力進行融合,自動生成的辦理流程和操作指導,都提供了檢索來源。目前,原來需要平均5次的操作降低為1次,辦結時間縮短5分鐘以上。

在制造行業,無論是高精工藝,還是生產計劃,都需要分毫不差,一旦出現錯誤,可能會釀成事故。盤古大模型已走進華為生產線,在學習了各種數據,包括能準確理解發給計劃員的郵件,并轉化為調度指令,再通過天籌AI求解器進行運算,現在1分鐘可準確做出未來3天的生產計劃。

大模型如何在要求精準的行業應用中不跑偏,仍是行業性挑戰。目前業界都在進行探索改進。華為云戰略與產業發展部總裁黃瑾稱,除了要不斷提升大模型的水平外,依賴現有高質量知識,包括外掛插件、搜索引擎、相關數據庫、知識圖譜、行業知識庫等,都能在一定程度上保障大模型應用的精準和專業。而此前,包括微軟在內的業界認為,當下大模型的定位“還是一個專家助手”,并非完全替代人。

一些行業企業還有一個疑惑,他們關注到一些應用如礦山,用的最多的是攝像頭和圖像分析,這真的需要大模型嗎?業界人士告訴數智前線,實際上,大模型的出現,提升了政企客戶的期望值。他們應用大模型,不再為解決單點問題,而是期望大模型充當企業智能化的“一個底座”。

從這次華為展示的盤古礦山大模型來看,覆蓋煤礦的采、掘、機、運、通、洗、選等業務流程下的1000個細分場景,大模型將充當底座。在華為與深圳福田區政府的合作中,此前在數字政府1.0項目中,福田區建設了很多感知系統。現在,將這些系統接入大模型后,相當于給政務系統配上了智慧大腦,客戶認為這才是數字政府2.0。

大模型在行業中的應用才剛剛開始,由于行業數據的可獲得性及開放度不高,行業Know-how復雜等挑戰,大模型在行業的落地進展較慢。張平安稱,未來隨著不斷深入行業,華為云會推出更多行業大模型。而這也是當下競爭的關鍵。

04、百模大戰,華為的發力點在哪里?

業界看到,在推出大模型的企業中,他們的投入重點各有不同。在7月7日開發者大會上,張平安強調了大模型所需的各項根技術。他稱,一方面大模型的創新來自模型本身創新;另一方面則必須依靠AI各項根技術,“如果沒有算力技術、沒有算子,沒有開發框架,沒有開發平臺、工程平臺,沒有開放性,很難做到大模型好用,給各行業賦予價值”。

業界觀察,華為不僅提及昇騰芯片,更強調上述軟硬件根技術組成的昇騰云底座。由于行業中最成熟的GPU以及相關軟件,華為都不可用,它轉而發展全棧根技術:最底層是鯤鵬、昇騰為基礎的AI算力云平臺,之上是異構計算架構CANN、全場景AI框架昇思MindSpore,以及AI開發生產線ModelArts。“現在基于華為的AI根技術,我們大模型訓練效能不僅不落后,還可以調優到業界主流GPU的1.1倍。”張平安在大會上透露了這個業界關注的數字。

7月7日,華為云也將昇騰AI云服務對外開放。華為云2000P Flops單集群的昇騰AI云服務在烏蘭察布和貴安同時上線。昇騰云服務除了支持華為的AI框架Mindspore外,還支持Pytorch、Tensorflow等主流AI框架,框架中的90%算子,可以通過華為端到端遷移工具從GPU平滑遷移到昇騰。

有業界人士稱,目前GPU之所以一卡難求是因為大家都急著用,未來隨著多樣化算力走向商用,AI算力將更為多元化。據悉,美團用30天時間,已將70多個AI應用遷移到了昇騰AI云。華為還與美團的開發人員一起,將美團30個算子進行了深度優化,AI算力的效能比原來提升了30%。

AI算力是一個堪稱比摩爾定律發展速度還快的領域。目前,包括英偉達在內的企業都在風暴般研發新框架,拉升AI算力。張平安稱,華為對AI根技術堆棧的發展是一條長期道路,除了大量自身技術外,還要與客戶應用場景、算子結合。

張平安表示,為了幫助全球客戶、伙伴、開發者訓練和使用大模型,華為云致力于為全球客戶打造世界AI另一極,為所有AI開發者提供新的選擇。

05、盤古大模型未來怎么走?

目前,業界大模型處于快速演進狀態。業界人士稱,在過去幾個月時間中,大模型在訓練、推理方面,每天都有很大變化。

“我們內部做了一個非常激進的roadmap(技術路線圖)。”張平安說,華為云現在是“All in盤古大模型”,目標圖制定得密密麻麻。他透露,這一階段的路標更多的不在盤古大模型參數提升等方向,比如,在昇騰AI云服務上,華為云剛剛發布的2000P Flops單集群,如果按照一張加速卡算力是400T的話,集群規模是6000張卡。

另外,更為重要的是向行業深處的挺進速度,“這也是我們價值最大的路標圖”。

張平安稱,盤古大模型在中國市場成功之后,在海外也會繼續拓展。在海外,既可以部署在華為昇騰云上,也可以經過合作伙伴的改造,部署在其他任何算力平臺上。“盤古更加是個軟件,它是一個AI的軟件系統。”數智前線獲悉,今年以來,華為在軟件發展戰略方面,內部也進行了多次大范圍研討,華為有意在軟件領域成為一家成功的企業。

此外,華為云CTO張宇昕針對業界關注的盤古大模型開發問題進行了回復。盤古大模型沒有采用開源技術,全棧技術為自主創新。

他介紹,從數據角度,L0基礎大模型訓練采用業界開放數據集。L1和L2面向行業的模型,采用了行業公開數據集以及行業客戶授權的數據。在這個過程中,他們需要采用多項技術保證數據處理過程中的隱私保護、安全合規要求,確保知識產權等。而基于此,華為盤古大模型也將走商業閉源道路。

本文為轉載內容,授權事宜請聯系原著作權人。

華為

7.8k
  • 盤前機會前瞻|華為發布首個全液冷兆瓦級超充!產業鏈迎來強催化,這幾家華為供應商已率先卡位超充賽道(附概念股)
  • 盤前機會前瞻|重磅催化來了!華為即將發布兆瓦超充產品,這幾家公司與華為在超充領域深度合作值得關注(附概念股)

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

華為云All in盤古大模型,回應業界五大疑惑

在BATH等科技大廠中,華為是最晚官宣大模型進展的巨頭,并選擇了一條與OpenAI不同的道路。華為背后到底是怎么思考的?

文|數智前線  趙艷秋

編輯|石兆

7月7日下午,華為云在東莞舉辦的華為開發者大會2023(HDC.Cloud 2023 ) 上,宣布推出盤古大模型3.0,這是華為云自2021年4月正式發布盤古大模型后的最新進展。

由于華為是BATH等科技大廠中,最晚官宣大模型進展的企業,又選擇了一條與OpenAI不同的道路——定位產業、大模型包含三層架構、多個模型。由此,華為的路線選擇、大模型在行業市場的可商用性、華為發力點等,都引發業界廣泛關注。

01、為什么不是一個大模型?

與OpenAI聚焦于GPT一個大模型不同,華為云盤古大模型3.0包含了三層架構、多個模型。為什么華為大模型與OpenAI的不一樣?

在大會上,華為常務董事、華為云CEO張平安系統介紹了華為云盤古大模型的情況。華為云于2019年投入AI大模型研發,并于2021年發布了基于Transformer架構的盤古NLP中文大模型和阿語大模型。華為云稱,與2021年發布的盤古大模型 1.0相比,此次主要在架構、訓練方法上進行了升級。

在華為云盤古大模型3.0架構中,第一層L0層有5個盤古基礎大模型,不僅有今年最火的自然語言大模型,還有視覺大模型、多模態大模型、預測大模型、科學計算大模型。第二層L1層目前有多個行業大模型,既有基于行業公開數據訓練的行業通用大模型,如政務、金融、氣象等,也有基于行業客戶自有數據,在盤古L0和L1上訓練而來的企業專有大模型。第三層L2層是針對更多細化場景的模型,可以開箱即用。

為什么華為云會選擇這樣的道路?實際上,此前也有企業采用類似做法,“本質上是更容易實現行業閉環落地”,有業界人士認為,這是一個更平滑的技術路線。通過不同層模型間的飛輪效應,既可以把模型越做越大,也可以形成真實的行業落地和用戶反饋閉環,讓模型越來越有用,“而不是一上來就是萬億參數的大模型,卻形不成用戶反饋閉環”。

這輪大模型變革以語言大模型為主,但有人士注意到,從華為云基礎大模型來看,除了語言大模型之外,還有預測、科學計算大模型這類比較專用、解決特定問題的模型。業界人士告訴數智前線,這些基礎大模型之間能形成互補,也是目前演進的一個趨勢——這一輪以語言大模型發起,逐步衍生出CV、多模態等大模型。張平安介紹,他們是考慮到行業客戶不同應用場景、不同時延、不同響應速度的多樣化需求而來。

值得注意的是,盤古大模型采用了“完全的分層解耦設計”,這是盤古3.0全新做的架構設計,也是此前各大企業推出大模型時未涉及的。根據張平安的介紹,這是為了更好地構筑一個商業模式——適配行業不同場景,必須要做到完全解耦。比如,有些企業只需要圖像分析,不需要文案生成,基礎大模型和能力集解耦后,他們就可以按需調用;甚至還有數據解耦,模型升級時,數據就可以復用;這個解耦架構,也實現了模型的并行迭代。

02、為什么做行業大模型?

業界觀察,自從OpenAI推出ChatGPT之后,美國絕大部分創新應用集中在C端。在中國市場,百度、阿里、商湯、科大訊飛、華為等科技大廠先后公布大模型最新進展。截至7月,全球已發布數百個大模型,中國有80多個。

業界觀察,國內企業在大模型落地時,都結合自身在已有業務上的積累,雖然有些模型看著較為類似,但落地思路上有較大差異。比如,百度“文心一言”大語言模型,正在搜索、地圖、音箱等方向上探索;同時也推出“文心千帆”大模型平臺,爭奪產業級市場。科大訊飛一面將大模型技術疊加到教育、辦公智能硬件等成熟業務中,另一面也介入此前一直在做的醫療、教育等企業數字化市場。

華為云此次發布的盤古大模型3.0,則聚焦在行業市場,這也有賴于它在政企市場上的長期積累。張平安稱,“AI for Industries”是華為云堅持的方向,“盤古大模型,不作詩只做事”,這在一定程度上代表了產業界的聲音。資深業界人士認為,ChatGPT核心并不是“Chat”,而是它的思維鏈、智能涌現、從感知到認知這些巨大的變化,它讓人工智能的通用性有了眉目,而不像過去一個場景、一個場景地去提供AI技術。

實際上,雖然這一輪大模型是先在消費級市場引發風潮,讓每個人意識到大模型的價值,但業界也達成共識,大模型是可能引發類似蒸汽機產業革命的技術范式變遷,因此,企業級市場也是商業競爭焦點。

張平安告訴數智前線,他們注意到OpenAI也有動作準備進入行業,“我覺得這才是正確的道路”。

03、大模型在行業是否達到可商用?

雖然業界在進軍行業,但由于目前大模型在企業級市場落地還處于早期階段,各種問題也引發了“大模型遠未達到可商用化程度”的說法。不過,從本次華為開發者大會上看,大模型落地的各種問題正在逐步解決,在產業中確實在發揮出價值。

舉例來說,大模型的最大弊端之一是擅于“一本正經地胡說八道”,這對于嚴謹的行業應用是致命的。而這次華為云演示了對準確性要求嚴苛的金融業和制造業的落地進展。

在金融行業,工行在全國有4萬多個網點、20多萬網點的柜員,經常要幫助客戶解決各種問題,需要在不同系統中進行多次查詢。工行和華為正在緊密合作,通過盤古打造工行的金融大模型。

華為云EI服務產品部部長尤鵬介紹,在合作中工行首先提出,大模型協助網點員工辦理業務時,第一要做到合規,這就意味著在用生成式大模型時,必須要能夠溯源。第二是要準確,年利率如果是3%,絕對不能說成3.5%。由此,基于盤古大模型的的銀行網點助手,將大模型的生成能力和檢索能力進行融合,自動生成的辦理流程和操作指導,都提供了檢索來源。目前,原來需要平均5次的操作降低為1次,辦結時間縮短5分鐘以上。

在制造行業,無論是高精工藝,還是生產計劃,都需要分毫不差,一旦出現錯誤,可能會釀成事故。盤古大模型已走進華為生產線,在學習了各種數據,包括能準確理解發給計劃員的郵件,并轉化為調度指令,再通過天籌AI求解器進行運算,現在1分鐘可準確做出未來3天的生產計劃。

大模型如何在要求精準的行業應用中不跑偏,仍是行業性挑戰。目前業界都在進行探索改進。華為云戰略與產業發展部總裁黃瑾稱,除了要不斷提升大模型的水平外,依賴現有高質量知識,包括外掛插件、搜索引擎、相關數據庫、知識圖譜、行業知識庫等,都能在一定程度上保障大模型應用的精準和專業。而此前,包括微軟在內的業界認為,當下大模型的定位“還是一個專家助手”,并非完全替代人。

一些行業企業還有一個疑惑,他們關注到一些應用如礦山,用的最多的是攝像頭和圖像分析,這真的需要大模型嗎?業界人士告訴數智前線,實際上,大模型的出現,提升了政企客戶的期望值。他們應用大模型,不再為解決單點問題,而是期望大模型充當企業智能化的“一個底座”。

從這次華為展示的盤古礦山大模型來看,覆蓋煤礦的采、掘、機、運、通、洗、選等業務流程下的1000個細分場景,大模型將充當底座。在華為與深圳福田區政府的合作中,此前在數字政府1.0項目中,福田區建設了很多感知系統。現在,將這些系統接入大模型后,相當于給政務系統配上了智慧大腦,客戶認為這才是數字政府2.0。

大模型在行業中的應用才剛剛開始,由于行業數據的可獲得性及開放度不高,行業Know-how復雜等挑戰,大模型在行業的落地進展較慢。張平安稱,未來隨著不斷深入行業,華為云會推出更多行業大模型。而這也是當下競爭的關鍵。

04、百模大戰,華為的發力點在哪里?

業界看到,在推出大模型的企業中,他們的投入重點各有不同。在7月7日開發者大會上,張平安強調了大模型所需的各項根技術。他稱,一方面大模型的創新來自模型本身創新;另一方面則必須依靠AI各項根技術,“如果沒有算力技術、沒有算子,沒有開發框架,沒有開發平臺、工程平臺,沒有開放性,很難做到大模型好用,給各行業賦予價值”。

業界觀察,華為不僅提及昇騰芯片,更強調上述軟硬件根技術組成的昇騰云底座。由于行業中最成熟的GPU以及相關軟件,華為都不可用,它轉而發展全棧根技術:最底層是鯤鵬、昇騰為基礎的AI算力云平臺,之上是異構計算架構CANN、全場景AI框架昇思MindSpore,以及AI開發生產線ModelArts。“現在基于華為的AI根技術,我們大模型訓練效能不僅不落后,還可以調優到業界主流GPU的1.1倍。”張平安在大會上透露了這個業界關注的數字。

7月7日,華為云也將昇騰AI云服務對外開放。華為云2000P Flops單集群的昇騰AI云服務在烏蘭察布和貴安同時上線。昇騰云服務除了支持華為的AI框架Mindspore外,還支持Pytorch、Tensorflow等主流AI框架,框架中的90%算子,可以通過華為端到端遷移工具從GPU平滑遷移到昇騰。

有業界人士稱,目前GPU之所以一卡難求是因為大家都急著用,未來隨著多樣化算力走向商用,AI算力將更為多元化。據悉,美團用30天時間,已將70多個AI應用遷移到了昇騰AI云。華為還與美團的開發人員一起,將美團30個算子進行了深度優化,AI算力的效能比原來提升了30%。

AI算力是一個堪稱比摩爾定律發展速度還快的領域。目前,包括英偉達在內的企業都在風暴般研發新框架,拉升AI算力。張平安稱,華為對AI根技術堆棧的發展是一條長期道路,除了大量自身技術外,還要與客戶應用場景、算子結合。

張平安表示,為了幫助全球客戶、伙伴、開發者訓練和使用大模型,華為云致力于為全球客戶打造世界AI另一極,為所有AI開發者提供新的選擇。

05、盤古大模型未來怎么走?

目前,業界大模型處于快速演進狀態。業界人士稱,在過去幾個月時間中,大模型在訓練、推理方面,每天都有很大變化。

“我們內部做了一個非常激進的roadmap(技術路線圖)。”張平安說,華為云現在是“All in盤古大模型”,目標圖制定得密密麻麻。他透露,這一階段的路標更多的不在盤古大模型參數提升等方向,比如,在昇騰AI云服務上,華為云剛剛發布的2000P Flops單集群,如果按照一張加速卡算力是400T的話,集群規模是6000張卡。

另外,更為重要的是向行業深處的挺進速度,“這也是我們價值最大的路標圖”。

張平安稱,盤古大模型在中國市場成功之后,在海外也會繼續拓展。在海外,既可以部署在華為昇騰云上,也可以經過合作伙伴的改造,部署在其他任何算力平臺上。“盤古更加是個軟件,它是一個AI的軟件系統。”數智前線獲悉,今年以來,華為在軟件發展戰略方面,內部也進行了多次大范圍研討,華為有意在軟件領域成為一家成功的企業。

此外,華為云CTO張宇昕針對業界關注的盤古大模型開發問題進行了回復。盤古大模型沒有采用開源技術,全棧技術為自主創新。

他介紹,從數據角度,L0基礎大模型訓練采用業界開放數據集。L1和L2面向行業的模型,采用了行業公開數據集以及行業客戶授權的數據。在這個過程中,他們需要采用多項技術保證數據處理過程中的隱私保護、安全合規要求,確保知識產權等。而基于此,華為盤古大模型也將走商業閉源道路。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 绥棱县| 灌云县| 临高县| 龙川县| 龙游县| 济源市| 抚宁县| 金乡县| 伊金霍洛旗| 淳安县| 务川| 财经| 望江县| 岚皋县| 江华| 麦盖提县| 陇西县| 库伦旗| 玛纳斯县| 天等县| 雅江县| 高要市| 鲁山县| 浦江县| 承德市| 周至县| 慈利县| 北票市| 九龙县| 棋牌| 垫江县| 商河县| 定日县| 通山县| 久治县| 雷州市| 射阳县| 甘泉县| 和龙市| 个旧市| 晋城|