今年開年,最火的莫過於ChatGPT的相關討論,這個提供了非常強大的AI處理,並且整個平臺也提供了很多對應的API進行接入的處理,使得我們可以在各種程式上無縫接入AI的後端處理,從而實現智慧AI的各種應用。ChatGPT的API可以在前端,以及一些後端進行API的接入,本篇隨筆主要介紹基於ChatGPT的API的C#接入研究。
ChatGPT(全名:Chat Generative Pre-trained Transformer),美國OpenAI研發的聊天機器人程式 ,於2022年11月30日釋出。ChatGPT是人工智慧技術驅動的自然語言處理工具,它能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視訊指令碼、文案、翻譯、程式碼,寫論文 等任務。
ChatGPT是美國人工智慧研究實驗室OpenAI新推出的一種人工智慧技術驅動的自然語言處理工具,使用了Transformer神經網路架構,也是GPT-3.5架構,這是一種用於處理序列資料的模型,擁有語言理解和文字生成能力,尤其是它會通過連線大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT具備上知天文下知地理,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。ChatGPT不單是聊天機器人,還能進行撰寫郵件、視訊指令碼、文案、翻譯、程式碼等任務。
ChatGPT 的官網地址如下:https://platform.openai.com/ ,如果我們需要使用它的對話處理以及強大的API能力,需要註冊才能使用,至於如何註冊以及接收驗證碼的操作,請百度一下一下即可,這裡忽略,只是介紹它的功能以及如何介入使用。
ChatGPT 可以做很多不同型別的工作,常規的問答聊天,編寫各種語言的應用程式碼,編寫論文、摘要等,以及圖片處理,翻譯等等,如下是它們的一些功能分類和介紹。
如我們可以在對話中測試其聊天/應答功能。
我們也可以讓它編寫一段操作程式碼,如下所示。
如果我們要了解ChatGPT平臺的API介紹,可以參考 https://platform.openai.com/docs/api-reference/introduction ,其大概分類也是很常規的功能應用相關的,如下是它的列表介紹。
我們要學會如何使用API的話,需要了解它的相關模型概念,以及對各種處理的定義。
從上面的API介紹中,我們可以看到,API平臺沒有針對不同的語意給出不同的實現方式,只是給出了一個通用的呼叫方式,主要是基於輸入引數,響應的資料格式的參考,具體的不同語言的應用如C#的接入,需要根據實際的格式進行對接。
主要的程式碼如下所示。
using RestSharp; using System; namespace Gpt3APIExample { class Program { static void Main(string[] args) { // OpenAI API地址 string apiUrl = "https://api.openai.com/v1/engines/gpt-3/jobs"; // OpenAI API金鑰 string apiKey = "YOUR_API_KEY"; // 建立一個RestClient物件 var client = new RestClient(apiUrl); // 建立一個RestRequest物件 var request = new RestRequest(Method.POST); // 在請求頭中新增API金鑰 request.AddHeader("Authorization", "Bearer " + apiKey); // 新增請求內容 request.AddJsonBody(new { model = "text-davinci-002", prompt = "What is the capital of France?", max_tokens = 100, n = 1, stop = null, temperature = 0.5, }); // 傳送請求並獲取響應 IRestResponse response = client.Execute(request); // 顯示響應內容 Console.WriteLine(response.Content); Console.ReadLine(); } } }
這個程式碼主要就是針對輸入資訊和輸出的內容進行簡單的包裝,使用 RestSharp 的一個Http類庫進行存取的包裝。
而為了更好的使用ChatGPT的API處理,我們可以使用更高階一點的類庫,如下面介紹的兩個開源C#包裝ChatGPT的類庫:
https://github.com/OkGoDoIt/OpenAI-API-dotnet
https://github.com/RageAgainstThePixel/OpenAI-DotNet
我覺得他們都是很不錯的,都是基於ChatGPT的API格式進行了一定程度的物件導向的包裝,使得我們基於C#開發起來更方便。
例如我們基於 https://github.com/RageAgainstThePixel/OpenAI-DotNet
來檢視使用程式碼,它的介紹也比較詳細,基本上覆蓋到了各個方面。
我們可以模仿來生成自己的程式碼即可,如下所示。
/// <summary> /// 基於OpenAI-DotNet的使用 /// </summary> public class Test2 { public static async Task ExcuteCode() { var api = new OpenAIClient(new OpenAIAuthentication(Constants.ApiKey)); var result = await api.CompletionsEndpoint.CreateCompletionAsync("讀取圖片檔案的展示到表單的C#程式碼", null, null, 1000, 0.1); Log.Information(result.ToJson()); }
執行效果,可以看到輸出的結果。
對於圖片的生成和處理,我們也可以按照類似的API進行呼叫介面,如下是一段尋找圖片的程式碼。
var results = await api.ImagesEndPoint.GenerateImageAsync("中國布達拉宮的全景圖片", 1, ImageSize.Large); foreach (var item in results) { Log.Information(item); }
為了驗證圖片的AI處理,我們生成兩張正方形的圖片,圖片右下角扣掉一塊空白的圖片,圖片格式使用PNG格式,然後呼叫如下程式碼進行替換處理。
var imageAssetPath = "images/休息區.png"; var maskAssetPath = "images/休息區2.png"; var imageResults = await api.ImagesEndPoint.CreateImageEditAsync(Path.GetFullPath(imageAssetPath), Path.GetFullPath(maskAssetPath), "陽光明媚的室內休息區,有一個鴨子在池塘中", 1, ImageSize.Small); foreach (var item in imageResults) { Log.Information(item); }
生成後的圖片效果如下所示。
生成的空白地方,填入一個所需要的區域,紅色框是我加上去醒目的。