簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

CPU+GPU異構計算成芯片巨頭新寵

掃一掃下載界面新聞APP

CPU+GPU異構計算成芯片巨頭新寵

英特爾宣布將在未來一年半內取消多款服務器GPU產品的發布計劃,其中包括HPC級的Rialto Bridge GPU,以全力開發基于Falcon Shores的混合芯片。

文|半導體產業縱橫

近年來,隨著AI應用的快速發展,引發一場算力革命,異構計算也站在風口浪尖。

異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。常見的計算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。目前“CPU+GPU”以及“CPU+FPGA”都是受業界關注的異構計算平臺。

近日,英特爾宣布將在未來一年半內取消多款服務器GPU產品的發布計劃,其中包括HPC級的Rialto Bridge GPU,以全力開發基于Falcon Shores的混合芯片。英特爾新一代Falcon Shores 專為超級計算應用而設計,將CPU和GPU技術結合到一個芯片封裝中,屆時將作為純GPU架構面世。

值得注意的是,AMD 的Instinct MI300和英偉達的Grace Hopper超級芯片也是采用“CPU+GPU”的異構形式。

01、CPU與GPU的區別

CPU即中央處理器(Central Processing Unit),作為計算機系統的運算和控制核心,主要負責多任務管理、調度,具有很強的通用性,是計算機的核心領導部件,好比人的大腦。不過其計算能力并不強,更擅長邏輯控制。

GPU即圖形處理器(Graphics Processing Unit),采用數量眾多的計算單元和超長的流水線,擅長進行圖像處理、并行計算。對于復雜的單個計算任務來說,CPU 的執行效率更高,通用性更強;對于圖形圖像這種矩陣式多像素點的簡單計算,更適合用 GPU 來處理。AI 領域中用于圖像識別的深度學習、用于決策和推理的機器學習以及超級計算都需要大規模的并行計算,因此更適合采用 GPU 架構。

多核 CPU 與 GPU 的計算網格(圖中綠色方格為計算單元)

CPU和GPU還有一個很大的區別就是:CPU可單獨作用,處理復雜的邏輯運算和不同的數據類型,但當需要處理大量類型統一的數據時,則可調用GPU進行并行計算。但GPU無法單獨工作,必須由CPU進行控制調用才能工作。

02、CPU+GPU架構的優勢及應用

當CPU和GPU協同工作時,因為 CPU 包含幾個專為串行處理而優化的核心,而 GPU 則由數以千計更小、更節能的核心組成,這些核心專為提供強勁的并行運算性能而設計。程序的串行部分在 CPU 上運行,而并行部分則在 GPU上運行。GPU 已經發展到成熟階段,可輕松執行現實生活中的各種應用程序,而且程序運行速度已遠遠超過使用多核系統時的情形。因此,CPU和GPU的結合剛好可以解決深度學習模型訓練在CPU上耗時長的問題,提升深度學習模型的訓練效率。

隨著CPU與GPU的結合,其相較于單獨CPU與GPU的應用場景也不斷拓寬。

第一,CPU+GPU架構適用于處理高性能計算。伴隨著高性能計算類應用的發展,驅動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經無法處理更復雜、更多樣的數據。數據中心如何在增強算力和性能的同時,具備應對多類型任務的處理能力,成為全球性的技術難題。CPU+GPU的異構并行計算架構作為高性能計算的一種主流解決方案,受到廣泛關注。

第二,CPU+GPU架構適用于處理數據中心產生的海量數據。數據爆炸時代來臨,使用單一架構來處理數據的時代已經過去。比如:個人互聯網用戶每天產生約1GB數據,智能汽車每天約50GB,智能醫院每天約3TB數據,智慧城市每天約50PB數據。數據的數量和多樣性以及數據處理的地點、時間和方式也在迅速變化。無論工作任務是在邊緣還是在云中,不管是人工智能工作任務還是存儲工作任務,都需要有正確的架構和軟件來充分利用這些特點。

第三,CPU+GPU架構可以共享內存空間,消除冗余內存副本來改善問題。在此前的技術中,雖然GPU和CPU已整合到同一個芯片上,但是芯片在運算時要定位內存的位置仍然得經過繁雜的步驟,這是因為CPU和GPU的內存池仍然是獨立運作。為了解決兩者內存池獨立的運算問題,當CPU程式需要在GPU上進行部分運算時,CPU都必須從CPU的內存上復制所有的資料到GPU的內存上,而當GPU上的運算完成時,這些資料還得再復制回到CPU內存上。然而,將CPU與GPU放入同一架構,就能夠消除冗余內存副本來改善問題,處理器不再需要將數據復制到自己的專用內存池來訪問/更改該數據。統一內存池還意味著不需要第二個內存芯片池,即連接到CPU的DRAM。

因此,通過CPU+GPU異構并行計算架構組成的服務器,正成為服務器市場中的一匹黑馬?,F在已有多家芯片廠商開始跟進。

03、芯片巨頭的香餑餑?

英特爾的Falcon Shores

英特爾的Falcon Shores XPU專為超級計算應用而設計,其將CPU和GPU合并到一個混合匹配芯片包中。Falcon Shores代表了英特爾異構架構設計的延續,其最終目標是每瓦性能提高5倍,x86插槽計算密度提高5倍以及現有服務器芯片的內存容量和帶寬提高5倍。英特爾的高性能計算CPU和GPU路線圖與Falcon Shores匯合,表明這些芯片將在未來同時發揮這兩個作用。

英特爾超級計算集團副總裁兼總經理杰夫·麥克維(Jeff McVeigh)說,延遲推出的Falcon Shores將在2025年首次推出GPU內核,但尚未表明何時將CPU內核集成到設計中。因此,英特爾以HPC為中心的設計將落后于競爭對手數年。

英偉達的Grace Hopper超級芯片

2021年,英偉達推出解決HPC和大規模人工智能應用程序的Grace Hopper超級芯片。這是一款完全專為大規模 AI 和高性能計算應用打造的突破性加速 CPU。它通過英偉達 NVLink-C2C 技術將 Grace 和 Hopper 架構相結合,為加速 AI 和 HPC 應用提供 CPU+GPU 相結合的一致內存模型。

英偉達官方表示,使用NVLink-C2C互連,Grace CPU將數據傳輸到Hopper GPU的速度比傳統CPU快15倍。另外,采用CPU+GPU的Grace Hopper核心數減半,LPDDR5X內存也只有512GB,但多了顯卡的80GB HBM3內存,總帶寬可達3.5TB/s,代價是功耗1000W,每個機架容納42個節點。

英偉達Grace Hopper超級芯片計劃于2023年上半年推出。

AMD的 Instinct MI300

在近日的 CES 2023 展會上,AMD 披露了面向下一代數據中心的 APU 加速卡產品 Instinct MI300。這顆芯片采用多芯片、多IP整合封裝設計,5nm先進制造工藝,晶體管數量多達1460億個。它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量的HBM3高帶寬內存。

在技術方面,MI300支持第四代Infinity Fabric總線、CXL 3.0總線、統一內存架構、新的數學計算格式,號稱AI性能比上代提升多達8倍,可滿足百億億次計算需求。

AMD CEO蘇姿豐近日確認,Instinct MI300將在今年下半年正式推出。

英特爾的Falcon Shores XPU是與英偉達的Grace Hopper 超級芯片和AMD Instinct MI300數據中心APU競爭的關鍵。英偉達的Grace和AMD的MI300都將于今年推出。值得注意的是,三家均選擇了Chiplet技術。

04、未來押注超異構計算

關于異構計算,英特爾中國研究院院長宋繼強曾表示:“在2023年,大家已經完全接受了要通過異構計算解決未來系統的設計和優化問題。在2020年的時候,市場還在討論異構集成是怎么一回事。而在2023年,大家都會基于功能的有效性、設計的難易程度、成本等方面的考量,自覺采用異構計算的方式?!?/p>

關于對當下的算力演進方向的新判斷,宋繼強還提到:“傳統異構計算并不能滿足現在計算的要求。而“超異構計算”,已逐漸成為業界思考的一個趨勢”。

從實際來看,英特爾也確實正在押注“超異構計算”這條道路。

英特爾提出的“超異構計算”概念,在一定程度上可以理解為通過封裝技術所實現的模塊級系統集成,即通過先進封裝技術將多個Chiplet裝配到一個封裝模塊當中,既簡化了SOC的復雜技術,更加靈活,又避免了PCB板級集成的性能和功耗瓶頸。

英特爾的“超異構計算”路線以“Foveros”3D封裝技術為基礎。相比SiP只能實現邏輯芯片與內存的集成,“Foveros”可以在邏輯芯片與邏輯芯片之間實現真正的三維集成,使得芯片面積更小,同時保證芯片間的帶寬更大、速度更快、功耗更低。

不過,英特爾的“超異構計算”的創新之處并不僅局限于3D封裝這一個層面。事實上,在制程、架構、內存、互連、安全、軟件等多個層面均具有領先優勢?!俺悩嬘嬎恪钡膶崿F是建立在整合其多層面技術優勢基礎上的。

除了英特爾之外,英偉達也已經在執行層面全面行動。英偉達在云、網、邊、端等復雜計算場景,基本上都有重量級的產品和非常清晰的迭代路線圖。

本文為轉載內容,授權事宜請聯系原著作權人。

英特爾

6.1k
  • 裁員瘦身、押注代工量產,"救火隊長"陳立武能拯救英特爾嗎?
  • 國盛智科(688558.SH):2025年一季報凈利潤為3463.36萬元

英偉達

7k
  • 美股三大指數集體收漲,道指、標普500指數均連漲六日
  • 傳將分拆中國業務,英偉達:這些說法沒有任何依據

AMD

4.2k
  • 魏哲家:臺積電有意加碼美國投資,30% 2nm及以下產能將美國生產
  • 美股三大指數大幅收跌,大型科技股集體下挫

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

CPU+GPU異構計算成芯片巨頭新寵

英特爾宣布將在未來一年半內取消多款服務器GPU產品的發布計劃,其中包括HPC級的Rialto Bridge GPU,以全力開發基于Falcon Shores的混合芯片。

文|半導體產業縱橫

近年來,隨著AI應用的快速發展,引發一場算力革命,異構計算也站在風口浪尖。

異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。常見的計算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。目前“CPU+GPU”以及“CPU+FPGA”都是受業界關注的異構計算平臺。

近日,英特爾宣布將在未來一年半內取消多款服務器GPU產品的發布計劃,其中包括HPC級的Rialto Bridge GPU,以全力開發基于Falcon Shores的混合芯片。英特爾新一代Falcon Shores 專為超級計算應用而設計,將CPU和GPU技術結合到一個芯片封裝中,屆時將作為純GPU架構面世。

值得注意的是,AMD 的Instinct MI300和英偉達的Grace Hopper超級芯片也是采用“CPU+GPU”的異構形式。

01、CPU與GPU的區別

CPU即中央處理器(Central Processing Unit),作為計算機系統的運算和控制核心,主要負責多任務管理、調度,具有很強的通用性,是計算機的核心領導部件,好比人的大腦。不過其計算能力并不強,更擅長邏輯控制。

GPU即圖形處理器(Graphics Processing Unit),采用數量眾多的計算單元和超長的流水線,擅長進行圖像處理、并行計算。對于復雜的單個計算任務來說,CPU 的執行效率更高,通用性更強;對于圖形圖像這種矩陣式多像素點的簡單計算,更適合用 GPU 來處理。AI 領域中用于圖像識別的深度學習、用于決策和推理的機器學習以及超級計算都需要大規模的并行計算,因此更適合采用 GPU 架構。

多核 CPU 與 GPU 的計算網格(圖中綠色方格為計算單元)

CPU和GPU還有一個很大的區別就是:CPU可單獨作用,處理復雜的邏輯運算和不同的數據類型,但當需要處理大量類型統一的數據時,則可調用GPU進行并行計算。但GPU無法單獨工作,必須由CPU進行控制調用才能工作。

02、CPU+GPU架構的優勢及應用

當CPU和GPU協同工作時,因為 CPU 包含幾個專為串行處理而優化的核心,而 GPU 則由數以千計更小、更節能的核心組成,這些核心專為提供強勁的并行運算性能而設計。程序的串行部分在 CPU 上運行,而并行部分則在 GPU上運行。GPU 已經發展到成熟階段,可輕松執行現實生活中的各種應用程序,而且程序運行速度已遠遠超過使用多核系統時的情形。因此,CPU和GPU的結合剛好可以解決深度學習模型訓練在CPU上耗時長的問題,提升深度學習模型的訓練效率。

隨著CPU與GPU的結合,其相較于單獨CPU與GPU的應用場景也不斷拓寬。

第一,CPU+GPU架構適用于處理高性能計算。伴隨著高性能計算類應用的發展,驅動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經無法處理更復雜、更多樣的數據。數據中心如何在增強算力和性能的同時,具備應對多類型任務的處理能力,成為全球性的技術難題。CPU+GPU的異構并行計算架構作為高性能計算的一種主流解決方案,受到廣泛關注。

第二,CPU+GPU架構適用于處理數據中心產生的海量數據。數據爆炸時代來臨,使用單一架構來處理數據的時代已經過去。比如:個人互聯網用戶每天產生約1GB數據,智能汽車每天約50GB,智能醫院每天約3TB數據,智慧城市每天約50PB數據。數據的數量和多樣性以及數據處理的地點、時間和方式也在迅速變化。無論工作任務是在邊緣還是在云中,不管是人工智能工作任務還是存儲工作任務,都需要有正確的架構和軟件來充分利用這些特點。

第三,CPU+GPU架構可以共享內存空間,消除冗余內存副本來改善問題。在此前的技術中,雖然GPU和CPU已整合到同一個芯片上,但是芯片在運算時要定位內存的位置仍然得經過繁雜的步驟,這是因為CPU和GPU的內存池仍然是獨立運作。為了解決兩者內存池獨立的運算問題,當CPU程式需要在GPU上進行部分運算時,CPU都必須從CPU的內存上復制所有的資料到GPU的內存上,而當GPU上的運算完成時,這些資料還得再復制回到CPU內存上。然而,將CPU與GPU放入同一架構,就能夠消除冗余內存副本來改善問題,處理器不再需要將數據復制到自己的專用內存池來訪問/更改該數據。統一內存池還意味著不需要第二個內存芯片池,即連接到CPU的DRAM。

因此,通過CPU+GPU異構并行計算架構組成的服務器,正成為服務器市場中的一匹黑馬。現在已有多家芯片廠商開始跟進。

03、芯片巨頭的香餑餑?

英特爾的Falcon Shores

英特爾的Falcon Shores XPU專為超級計算應用而設計,其將CPU和GPU合并到一個混合匹配芯片包中。Falcon Shores代表了英特爾異構架構設計的延續,其最終目標是每瓦性能提高5倍,x86插槽計算密度提高5倍以及現有服務器芯片的內存容量和帶寬提高5倍。英特爾的高性能計算CPU和GPU路線圖與Falcon Shores匯合,表明這些芯片將在未來同時發揮這兩個作用。

英特爾超級計算集團副總裁兼總經理杰夫·麥克維(Jeff McVeigh)說,延遲推出的Falcon Shores將在2025年首次推出GPU內核,但尚未表明何時將CPU內核集成到設計中。因此,英特爾以HPC為中心的設計將落后于競爭對手數年。

英偉達的Grace Hopper超級芯片

2021年,英偉達推出解決HPC和大規模人工智能應用程序的Grace Hopper超級芯片。這是一款完全專為大規模 AI 和高性能計算應用打造的突破性加速 CPU。它通過英偉達 NVLink-C2C 技術將 Grace 和 Hopper 架構相結合,為加速 AI 和 HPC 應用提供 CPU+GPU 相結合的一致內存模型。

英偉達官方表示,使用NVLink-C2C互連,Grace CPU將數據傳輸到Hopper GPU的速度比傳統CPU快15倍。另外,采用CPU+GPU的Grace Hopper核心數減半,LPDDR5X內存也只有512GB,但多了顯卡的80GB HBM3內存,總帶寬可達3.5TB/s,代價是功耗1000W,每個機架容納42個節點。

英偉達Grace Hopper超級芯片計劃于2023年上半年推出。

AMD的 Instinct MI300

在近日的 CES 2023 展會上,AMD 披露了面向下一代數據中心的 APU 加速卡產品 Instinct MI300。這顆芯片采用多芯片、多IP整合封裝設計,5nm先進制造工藝,晶體管數量多達1460億個。它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量的HBM3高帶寬內存。

在技術方面,MI300支持第四代Infinity Fabric總線、CXL 3.0總線、統一內存架構、新的數學計算格式,號稱AI性能比上代提升多達8倍,可滿足百億億次計算需求。

AMD CEO蘇姿豐近日確認,Instinct MI300將在今年下半年正式推出。

英特爾的Falcon Shores XPU是與英偉達的Grace Hopper 超級芯片和AMD Instinct MI300數據中心APU競爭的關鍵。英偉達的Grace和AMD的MI300都將于今年推出。值得注意的是,三家均選擇了Chiplet技術。

04、未來押注超異構計算

關于異構計算,英特爾中國研究院院長宋繼強曾表示:“在2023年,大家已經完全接受了要通過異構計算解決未來系統的設計和優化問題。在2020年的時候,市場還在討論異構集成是怎么一回事。而在2023年,大家都會基于功能的有效性、設計的難易程度、成本等方面的考量,自覺采用異構計算的方式。”

關于對當下的算力演進方向的新判斷,宋繼強還提到:“傳統異構計算并不能滿足現在計算的要求。而“超異構計算”,已逐漸成為業界思考的一個趨勢”。

從實際來看,英特爾也確實正在押注“超異構計算”這條道路。

英特爾提出的“超異構計算”概念,在一定程度上可以理解為通過封裝技術所實現的模塊級系統集成,即通過先進封裝技術將多個Chiplet裝配到一個封裝模塊當中,既簡化了SOC的復雜技術,更加靈活,又避免了PCB板級集成的性能和功耗瓶頸。

英特爾的“超異構計算”路線以“Foveros”3D封裝技術為基礎。相比SiP只能實現邏輯芯片與內存的集成,“Foveros”可以在邏輯芯片與邏輯芯片之間實現真正的三維集成,使得芯片面積更小,同時保證芯片間的帶寬更大、速度更快、功耗更低。

不過,英特爾的“超異構計算”的創新之處并不僅局限于3D封裝這一個層面。事實上,在制程、架構、內存、互連、安全、軟件等多個層面均具有領先優勢?!俺悩嬘嬎恪钡膶崿F是建立在整合其多層面技術優勢基礎上的。

除了英特爾之外,英偉達也已經在執行層面全面行動。英偉達在云、網、邊、端等復雜計算場景,基本上都有重量級的產品和非常清晰的迭代路線圖。

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 固镇县| 屯门区| 河东区| 湖北省| 东台市| 牟定县| 罗平县| 屏边| 游戏| 清新县| 浦北县| 尼玛县| 秦安县| 于田县| 山阳县| 腾冲县| 苍梧县| 淅川县| 华安县| 新沂市| 仁怀市| 汝城县| 洛浦县| 若羌县| 蒲城县| 中方县| 深泽县| 祁连县| 鄂伦春自治旗| 衡阳市| 中卫市| 嵩明县| 新野县| 日照市| 南部县| 祥云县| 丹棱县| 延庆县| 彭州市| 泰和县| 涿州市|