最近,人工智慧社群在開發更大、更高效能的語言模型方面取得了顯著的進展,例如 Falcon 40B、LLaMa-2 70B、Falcon 40B、MPT 30B; 以及在影象領域的模型,如 SD2.1 和 SDXL 。這些進步無疑推動了人工智慧的發展,使其具有高度多功能和最先進的影象生成和語言理解能力。然而,在我們驚歎於這些模型的強大和複雜性之餘,必須認識到一個日益增長的需求: 使人工智慧模型體量更小、執行更高效、更易於存取,特別是通過開源它們來共建生態。
在 Segmind,我們一直致力於如何使生成式 AI 更快、更便宜。去年,我們開源了我們加速的 SD-WebUI 庫 voltaML,它是一個基於 AITemplate/TensorRT 的推理加速庫,推理速度提高了 4-6 倍。為了繼續實現使生成模型更快、更小、更便宜的目標,我們正在開源我們壓縮的 SD 模型:SD-Small 和 SD-Tiny 的權重和訓練程式碼。預訓練的檢查點可在 Hugging Face