聊聊GPU與CPU的區別

2022-11-07 12:00:37

作者:小牛呼嚕嚕 | https://xiaoniuhululu.com
計算機內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕 」

前言

大家好,國慶馬上就要過去了,這不偷偷地進來學習了一波。之前小牛學過一點深度學習的知識,做了幾個專案,發現CPU來訓練就很慢,但是後來用裝有GPU的電腦來訓練,就明顯快的飛起,感覺很神奇。
此時心裡有個疑問,CPU造價那麼昂貴,效能比起記憶體、機械硬碟、固態硬碟,快的不是一個數量級的,這個GPU竟然比CPU還要厲害?

讓我們一起進入計算機的世界,一起來看看GPU和CPU!

CPU是什麼?

CPU,中央處理器(Central Processing Unit)是一臺計算機的運算核心和控制核心。CPU、內部記憶體和輸入/輸出裝置是電子計算機三大核心部件。其功能主要是解釋計算機指令以及處理計算機軟體中的資料。

GPU是什麼?

GPU,圖形處理器(Graphic Processing Unit)。一個專門的圖形核心處理器。GPU是顯示卡的「大腦」,決定了該顯示卡的檔次和大部分效能,同時也是2D顯示卡和3D顯示卡的區別依據。2D顯示晶片在處理3D影象和特效時主要依賴CPU的處理能力,稱為「軟加速」。3D顯示晶片是將三維影象和特效處理功能集中在顯示晶片內,也即所謂的「硬體加速」功能。

GPU與CPU的區別

GPU的由來

計算機對影象進行實時渲染, 一般需要經過圖形流水線的過程:頂點處理->圖元處理->柵格化->片段處理->畫素操作, 期間需要大量的計算,比如 640×480的解析度的螢幕,為了顯示遊戲畫面,大概有30萬個畫素需要渲染 ,為了讓人眼看到畫面動起來,其不像電影一樣只需要24幀,至少需要60幀, 即每秒我們需要完成1800 萬次單個畫素的渲染,每個畫素都需要經過圖形流水線過程,需要耗費大量資源

隨著影象處理對於計算機來說越來越重要,CPU越來越不從心了。CPU需要很強的通用性來處理各種不同的資料型別,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜。

另一方面,當晶片的整合度增加後,漏電流也隨之增大,但時脈頻率的提高有限,而且電晶體的線寬很快就會到達物理極限,因此晶片的效能很難靠減小電晶體線寬來提高。所以工程師們開始想辦法在設計上做文章:由於影象渲染的流程是固定的,通過硬體來解決這個問題,那就設計一個不需要考慮CPU的流水線停頓、亂序執行、 分支預測、記憶體管理、IO等等的各類問題的晶片 ,這其實就是GPU。

平行計算

我們重點再介紹一下CPU並行,即平行計算

平行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程,是提高計算機系統計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來共同求解同一問題,即將被求解的問題分解成若干個部分,各部分均由一個獨立的處理機來平行計算。

平行計算可分為時間上的並行空間上的並行

  1. 時間上的並行是指流水線技術,採用流水線,可以在同一時間啟動兩個或兩個以上的操作,大大提高計算效能。
  2. 空間上的並行是指多個處理機並行的執行計算,即通過網路將兩個以上的處理機連線起來,達到同時計算同一個任務的不同部分,或者單個處理機無法解決的大型問題。

GPU架構優化

我們來看看,現代的 GPU 為了圖形渲染、深度學習上有相較於CPU更強大的效能,做出來哪些設計上的優化:

  1. 由於GPU不需要考慮CPU的流水線停頓、亂序執行、 分支預測等等的各類問題,只需要流式計算的功能,所以內部許多CPU的電路是不需要的,這樣就節約了大量空間
  2. 由於GPU相比CPU電路就簡單多了,這樣就可以塞入更多的電路,即更多的"核",他們都是並行的,能夠極大提升效能
  3. 除了塞更多的核,為了更大程度提升GPU的效能,還採用 SIMT技術, 可以把多條資料,交給不同的執行緒去處理。類似於CPU中,SIMD技術,但是其只能一次性取出了固定 長度的多個資料,放到暫存器裡面,用一個指令去執行
  4. GPU同樣採用超執行緒技術, 當任務計算遇到停頓的時候,排程一些別的計算任務給當前的 ALU,這樣就需要保證核心中提供更多的執行上下文給ALU算數計算單元使用

我們再看看下面的CPU和GPU的架構圖,想必會有所得

  1. CPU架構圖

  1. GPU架構圖

從架構圖我們就能很明顯的看出,GPU的構成相對簡單,GPU採用流式平行計算模式,每一個計算單元可以單獨負責一個畫素點,每個畫素點不依賴旁邊畫素點的資料,所以每個計算單元都是獨立並行的,不需要控制器額外干涉。CPU的核數一般2,4,8核;但是GPU可以達到上千核
擁有數量非常多的計算單元和超長的流水線,計算能力非常強悍,特別適合處理大規模平行計算

我們需要知道GPU無法單獨工作,必須由CPU進行控制呼叫才能工作。CPU可單獨作用,處理複雜的邏輯運算和不同的資料型別,但當需要大量的處理型別統一的資料時,則可呼叫GPU進行平行計算。

GPU和CPU的應用場景

小結一下

  1. CPU需要很強的通用性來處理各種不同的資料型別,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜,採用的是精兵戰術,能力強,但數量少,擅長邏輯控制,序列運算。
  2. GPU面對的則是型別高度統一的、相互無依賴的大規模資料和不需要被打斷的純淨的計算環境,採用的是人海戰術,單個能力弱,但數量眾多,擅長的是大規模平行計算。

雖然GPU是為了影象處理而生的,隨著時代的發展,現在GPU不僅可以在影象處理領域大顯身手,它還被用來深度學習、科學計算、密碼破解、數值分析,海量資料處理,金融分析等需要大規模平行計算的領域。

參考資料:
《深入淺出計算機組成原理》

https://blog.csdn.net/shuiyixin/article/details/82915378

https://www.sohu.com/a/201309334_468740

https://zhuanlan.zhihu.com/p/156171120


本篇文章到這裡就結束啦,很感謝你能看到最後,如果覺得文章對你有幫助,別忘記關注我!更多精彩的文章