好不容易 在某電商平臺搶到了一塊3080顯示卡,高高興興的裝機準備大搞遊戲開始深度學習,卻遇到了很多麻煩,當然經過多方探索,終於也是解決了linux和Windows雙平臺的相容性問題,目前Pytorch和TensorFlow都能使用。
首先是linux平臺
最快方法:去NVIDIA官網下載cuda11.1,從這個版本才開始支援30系列顯示卡。同時記得把cudnn也順便下載了。cuda11.1自帶顯示卡驅動,所以顯示卡驅動無需單獨安裝,提前裝了也沒事。
深坑:Linux不同的發行版的桌面可能對30系顯示卡存在相容問題,請嘗試多個linux桌面,我是在unity下才能開啟桌面,Ubuntu自帶的Gnome(好像是這個?)不能進入。至於怎麼在無法進入桌面情況下安裝unity,請在命令臺ALT+CTRL+F3等命令,我不太清楚每個F鍵的區別,多多嘗試。
然後是Windows平臺,這個簡單很多,cuda11.1和cudnn都從Nv官網下載,一路裝到底也不會進不了桌面。
但是,裝好cuda和cudnn以及顯示卡驅動還只能算是入門關....
真正難的來了,GPU和cuda和框架如TF和torch等相容性,目前我的經驗是:
1.首選tf-nightly,pytorch-nightly等最新版本,這些都是cuda11.0環境編譯的,和cuda11.1相容性極好。(狂喜)
2.但是,很多專案,都使用的老版本的框架,這時候,tf選15.2的TF-GPU版本,實測相容cuda11.1(測試專案deepfacelab,可以執行基本操作不報錯,複雜操作暫時沒測試)
3.pytorch目前只是測試在pytorch-nightly下可以執行,執行了GPUbenchmark,根據測得的資料來看,3080效能,半精度低於2080ti 20%,單精度超2080ti 50%,雙精度更是好幾倍2080ti的效能。