每一週,我們的同事都會向社群的成員們釋出一些關於 Hugging Face 相關的更新,包括我們的產品和平臺更新、社群活動、學習資源和內容更新、開源庫和模型更新等,我們將其稱之為「Hugging News」,本期 Hugging News 有哪些有趣的訊息,快來看看吧!
我們正在繼續加深與預印本平臺 (arXiv.org) 的合作和整合,除了可以在論文頁面直接找到 Hugging Face 上的 Space 應用以外,我們又為 Hugging Face Hub 上線了一個論文頁面,比如: https://hf.co/papers/2211.05100
你還可以通過論文編號查詢模型、資料集和 Space 應用,也可以在模型和資料集頁面直接存取到論文頁面:
與此同時,如果你是某個論文的作者之一,你還可以在 Hugging Face 的論文頁面來「認領」和關聯你的 Hugging Face 賬號。
使用者的個人頁面也會顯示自己的論文:
快來試試看吧!
你可以在 Spaces 中使用 Docker SDK 來構建你的機器學習應用。上一週,我們還發布了一項與 Docker 的合作,現在你可以將你的 Space 應用一鍵使用 Docker 部署到其他環境中啦!
Hub 的頁面現在可以直接渲染 .ipynb 檔案 (Jupyter Notebook) 啦 ,除此之外,我們還與 Google Colab 團隊合作,現在 Colab 可以直接開啟託管在 Hugging Face Hub 上的 .ipynb 檔案啦:
Zapier 是一個自動化工作平臺,而無需編寫任何程式碼即可快速自動化很多業務流程。通過與Hugging Face 的整合,你可以使用將任意其他工作流程與 Hugging Face 提供的 AI 模型能力結合。快來試試看吧:
https://zapier.com/apps/hugging-face/integrations
Gradio 團隊發起了一個主題構建駭客鬆活動,快來參與吧!本次和駭客鬆活動為期兩週,你可以發揮創意和腦洞任意構建有意思的 Gradio 主題。下面有一個視訊來簡單介紹如何上手製作一個主題:
https://www.bilibili.com/video/BV1Xv4y1H7it/
如果你想參與,請在這個頁面檢視參與方法:
https://hf.co/Gradio-Themes
也可以在這個 Space 應用裡檢視別人做的主題:
https://hf.co/spaces/gradio/theme-gallery
bloomz.cpp 是一個用純 C/C++ 實現 Hugging Face 的 BLOOM 系列模型推理的程式碼庫。它建立在 @ggerganov 的 llama.cpp 庫之上,支援使用 BloomForCausalLM.from_pretrained()
載入的所有模型。庫還支援高階用法,可以進行更詳細的設定和自定義操作。
GitHub 地址: https://github.com/NouamaneTazi/bloomz.cpp
The Stack 是 BigCode 專案的一部分,這是一個包含了 300 種程式語言的開原始碼資料集。
資料集頁面: https://hf.co/datasets/bigcode/the-stack
Common Voice 的多語言資料集是最大的公開語音資料集,Mozilla 相信,一組大型、可公開使用的語音資料集,將可促進基於機器學習的語音技術的創新,與健康的商業競爭。目前,Common Voice 13 資料集已經在 Hugging Face Hub 上釋出,藉助 Datasets 庫,你只需要幾行程式碼就可以使用它。
資料集頁面: https://hf.co/datasets/mozilla-foundation/common_voice_13_0
TRL (Transformer Reinforcement Learning) 是一個用於訓練具有增強學習的 Transformer 語言模型的庫,可與