從CUDA Toolkit Archive下載相應版本的離線安裝包,這裡以11.7
為例。
開啟安裝包,在安裝選項選擇自定義模式,點選下一步。
在自定義安裝選項中,僅選擇CUDA元件(其中Nsight相關元件用於程式碼偵錯與效能分析),若未安裝顯示卡驅動,選擇NVIDIA GeForce Experience components並點選下一步。
可能會出現如下圖提示,警告你未安裝Visual Studio (可參考【Windows 開發環境設定——C++ 篇】VSCode+MSVC/MinGW/Clangd/LLDB+Xmake 安裝),這裡打勾點選下一步即可。
安裝完成後會自動新增到系統的PATH
環境變數,無需手動新增。
從cuDNN Archive下載相應版本的安裝包,這裡以8.4.1.50
為例。
下載完成後,將解壓縮包中的檔案複製到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50
目錄下。
將C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\bin
新增到系統的PATH
環境變數。
Zlib是cuDNN所需的資料壓縮軟體庫。在ZLib網站下載32bit
或64bit
的zlib123dll.zip
(一般為64bit
)。
下載完成後,將解壓縮包中的zlibwapi.dll
檔案複製到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\bin
目錄下,zlibwapi.lib
檔案複製到C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.4.1.50\lib
目錄下。
從NVIDIA TensorRT 8.x Download下載相應版本的安裝包,這裡以8.4.2.4
為例。
下載完成後,將解壓縮包中的檔案複製到C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4
目錄下。
將C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\bin
新增到系統的PATH
環境變數。
在終端開啟C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\python
目錄,以python 3.10
為例,輸入pip install tensorrt-8.4.2.4-cp310-none-win_amd64.whl
即可安裝。
在終端開啟C:\Program Files\NVIDIA GPU Computing Toolkit\TensorRT\v8.4.2.4\onnx_graphsurgeon
目錄,輸入pip install onnx_graphsurgeon-0.3.12-py2.py3-none-any.whl
即可安裝。