使用 Azure OpenAI 打造自己的 ChatGPT

一.前言

當今的人工智慧技術正在不斷髮展，越來越多的企業和個人開始探索人工智慧在各個領域中的應用。其中，在自然語言處理領域，OpenAI 的 GPT 系列模型成為了研究熱點。OpenAI 公司的 ChatGPT 帶起了一波 AI 應用的浪潮，一些科技公司都在努力跟進，比如百度的文心一言，Google 的 Bard 以及 Notion AI。就目前體驗來說還是 OpenAI ChatGPT 表現最好。

作為 OpenAI 公司的大股東，Microsoft 當然是使用其服務的一等公民，陸續推出了 GitHub Copilot、New Bing、Office 365 Copilot 和 Github Copilot X 等等。目前 Microsoft Azure 是獨一家的提供 OpenAI 雲服務的雲廠商，Azure OpenAI 提供的 API 服務使得構建和部署自己的 ChatGPT 成為了可能。

二.對比

Azure OpenAI 和 OpenAI 官方提供的服務基本是一致的，但是目前前者還是處於預覽版的狀態，一些功能還沒有完全開放。

注意：需要使用 Azure 國際版，點此進行申請

優點：

不受地域限制，國內可以直接呼叫。
可以自己上傳訓練資料進行訓練（據說很貴）。
Azure 多語言 SDK 支援。

缺點：

部分功能未開放，但 ChatGPT 的功能是沒問題的。
和 OpenAI 官方的 API 標準有差異，無法直接用一些只支援 OpenAI 官方API 的開源專案。

Azure OpenAI 也已經支援 GPT-4 了，需要單獨進行申請，博主的申請還沒通過本文暫時以 GPT-3.5 進行演示。

三.使用 Auzre OpenAI

1.建立服務

進入 Azure 後，直接搜尋 "Azure OpenAI"。

選擇你已經申請通過的訂閱進行建立。

如果該訂閱沒有啟動則不能建立。

2.建立模型部署

在資源管理->模型部署選擇需要的模型進行建立，每個模型只能建立1個部署。

2.Azure OpenAI Studio

模型建立完成以後，我們可以直接使用 Azure OpenAI Studio 來進行快速的測試。

ChatGPT 測試。

上傳自己的資料集。

四.API 呼叫

在資源管理->金鑰和終結點可以獲取 API 地址以及呼叫金鑰。

檢視 API 檔案

使用 POSTMAN 進行呼叫測試。

五.打造自己的 ChatGPT

1.Azure OpenAI Proxy

打造自己的 ChatGPT 推薦直接使用 https://github.com/Chanzhaoyu/chatgpt-web 這個專案。

前面我們說到 API 呼叫是有差異的，此專案目前還沒用直接支援 Azure OpenAI。我嘗試修改過這個專案，可以呼叫了但是有個問題，無法正常的自動結束對話，跟了程式碼發現有 Bug：

https://github.com/Chanzhaoyu/chatgpt-web -> https://github.com/transitive-bullshit/chatgpt-api -> https://github.com/rexxars/eventsource-parser

最終在 eventsource-parser 這個 package 裡，無法適應 Azure OpenAI 返回的結果，做過對比發現 Azure OpenAI 返回的呼叫最後少了一個換行 \n。

最終我便想了個方法，自己實現一個 Proxy 轉換 OpenAI 官方 API 標準到 Azure OpenAI 標準，這樣就能讓 Azure OpenAI 直接對接到任何支援 OpenAI 的任何專案中，並且可以順便修復上面所說的差異，讓 chatgpt-web 直接使用 Azure OpenAI。

專案地址：https://github.com/stulzq/azure-openai-proxy 希望大家點點 star。

2.搭建

最快的方式當然是使用 Docker，以下是 docker compose 指令碼：

version: '3'

services:
  chatgpt-web:
    image: chenzhaoyu94/chatgpt-web
    ports:
      - 3002:3002
    environment:
      OPENAI_API_KEY: <Auzre OpenAI API Key>
      OPENAI_API_BASE_URL: http://azure-openai:8080
      AUTH_SECRET_KEY: ""
      MAX_REQUEST_PER_HOUR: 1000
      TIMEOUT_MS: 60000
    depends_on:
      - azure-openai
    links:
      - azure-openai
    networks:
      - chatgpt-ns

  azure-openai:
    image: stulzq/azure-openai-proxy
    ports:
      - 8080:8080
    environment:
      AZURE_OPENAI_ENDPOINT: <Auzre OpenAI API Endpoint>
      AZURE_OPENAI_MODEL_MAPPER: <Auzre OpenAI API Deployment Mapper>
      AZURE_OPENAI_API_VER: 2023-03-15-preview
    networks:
      - chatgpt-ns

networks:
  chatgpt-ns:
    driver: bridge

啟動有 3 個環境變數需要設定：

變數名	說明
OPENAI_API_KEY	Azure 金鑰和終結點裡提供的 Key
AZURE_OPENAI_ENDPOINT	Azure 金鑰和終結點裡提供的終結點
AZURE_OPENAI_MODEL_MAPPER	Azure 部署模型名稱對映到 OpenAI 官方模型名稱

特別說明一下 AZURE_OPENAI_MODEL_MAPPER使用 OpenAI 官方標準發起的請求裡包含的模型名稱是固定的，在這裡可以查詢，而在 Azure OpenAI 模型部署時是可以自定義名稱的，請求 Azure yes需要提供這個部署模型的名稱，所以建立了一個對映關係。

比如我在 Azure 部署了一個 gpt-3.5-turbo模型，我設定的部署名稱為：xc-gpt-35，此時我的設定：

AZURE_OPENAI_MODEL_MAPPER: gpt-3.5-turbo=xc-gpt-35

六.結束

Azure OpenAI 平臺為開發人員提供了一個強大的工具，可以輕鬆地建立和訓練 ChatGPT 模型。隨著 ChatGPT 技術的不斷髮展，它將在越來越多的應用場景中發揮重要作用，為人們提供更加智慧和個性化的服務和體驗。