每天都要瀏覽大量AI相關新聞,是不是感到資訊量爆炸,有效資訊少?
這麼多新產品和新工具,到底哪些是真正是有價值的,哪些只是浮躁的一時熱點?
想參與AI產品和工具的開發,從哪裡能夠獲得大量的靈感和思路?
我會把AI相關的新趨勢、新想法、新思路,和成熟AI產品、工具、模型等整理在這裡,幫助大家去除資訊噪音,更高效的瞭解AI前沿發展。
主要圍繞:
作為本期刊的第一期,我們主要圍繞2023年4月釋出的相關產品和技術工具。
https://github.com/lvwzhen/law-cn-ai
該專案把 中國法律文書 作為知識庫,將知識庫embedding後存入向量資料庫,然後向用戶提供了完整介面,使用者可以用自然語言提問,後臺使用openAI的API,結合知識庫的現有知識進行自然語言的回答。
主要技術:
Hugging Face釋出了一個ChatGPT開源替代品名為HuggingChat。Hugging Face大家都懂的,可以理解成AI界的Github,很多註明的開源模型都在上面首發。
底層模型目前有兩種選擇:
FinChat.io是由ChatGPT提供技術支援的工具。它利用人工智慧生成關於公共公司和投資者的問題的答案。為了提供準確的答案,FinChat會提供推理、來源和資料等支援。實測效果有點酷炫。
https://designer.microsoft.com/
輸入文字,通過AI生成一個合適的設計圖,且支援動態圖。例如下面的文字描述"為我的油管頻道‘Science for Littles’設計一個動態的廣告"生成了右方的一些設計圖,生成速度非常快,還可調節圖片尺寸。
選擇了右方較為滿意的設計後,可以繼續在線上編輯器中修改你的設計,支援自由匯出各種格式與下載。
https://github.com/builderio/ai-shell
將chatGPT整合到你的shell中,用ai
命令進行操作
https://github.com/showlab/VLog
V是大寫,他可以將一段長視訊轉換成包含視覺和音訊資訊的檔案。通過將此檔案傳送到ChatGPT,我們可以針對這個視訊的內容進行自然語言聊天!當然,需要消耗你自己的openAI API額度。
https://huggingface.co/spaces/AIGC-Audio/AudioGPT
這個工具集裡包含了大量音訊相關的處理能力工具,大部分工具使用時需要填寫你自己的GPT API key,消耗你的額度,我試了一下,文字轉語音,一句5個詞的句子,消耗了我4000個token!(暴風哭泣!)
演講:
唱歌:
音訊處理:
https://github.com/NVIDIA/NeMo-Guardrails
NeMo Guardrails 是一個開源工具包,可以輕鬆地將可程式化護欄新增到基於 LLM 的對話系統中。Guardrails(或簡稱「rails」)是控制大型語言模型輸出的特定方式,例如不談論政治、以特定方式響應特定使用者請求、遵循預定義的對話路徑、使用特定語言風格、提取結構化資料等。
主要優勢:
https://github.com/imClumsyPanda/langchain-ChatGLM
一種利用 ChatGLM-6B + langchain 實現的基於本地知識的 ChatGLM 應用。支援將txt、markdown等格式的文字檔案上傳後,進行提問。會給出自然語言的回答,並且在最後會標註出參照本地文字的出處。
本專案實現原理如下圖所示,過程包括載入檔案 -> 讀取文字 -> 文字分割 -> 文字向量化 -> 問句向量化 -> 在文字向量中匹配出與問句向量最相似的top k個 -> 匹配出的文字作為上下文和問題一起新增到prompt中 -> 提交給LLM生成回答。
支援的LLM模型:
支援的Embedding 模型:
MLC LLM是一種通用解決方案,可以使任何語言模型在各種硬體後端和本地應用程式上在地化部署,同時為所有人提供一個高效的框架,以進一步優化模型效能,以適應其自身用例。
我們的使命是使每個人都能夠在其裝置上本地開發、優化和部署AI模型。
這個方向的探索如果出現突破,將大大減少模型部署和使用的門檻,讓全世界的低算力裝置也能加入AI算力陣營。
https://github.com/ninehills/chatglm-openai-api
讓開發者能夠用呼叫openAI API的方式呼叫其他開源模型,節省大量開發工作。
Github Trending
Meta360創新學院-AGI前夜