訊飛星火大模型與New Bing實測對比

昨天科大訊飛釋出了訊飛星火認知大模型，在釋出會現場實測大模型的7種核心能力，並行布了它在教育、辦公、汽車、數位員工領域的應用成果。科大訊飛董事長劉慶峰表示：認知大模型展示了通用人工智慧的曙光，訊飛星火認知大模型已在文字生成、知識問答、數學能力3種能力上超越ChatGPT。

NewBing 也全面開放給使用者，我參考光哥的《ChatGPT與New Bing實測對比，New Bing真的是採用GPT-4嗎？》文章中的三個推理能力測試進行了對比檢測。

通過幾個Prompt的測試，訊飛星火大模型輸出結果與New Bing的結果差遠了，3道題全部錯誤，光哥文章中已經總結了結論，New Bing用的模型應該是ChatGPT 3.5。

訊飛星火大模型：錯誤

New Bing：正確

訊飛星火大模型：錯誤

New Bing：錯誤

訊飛星火大模型：錯誤

New Bing：錯誤

訊飛星火大模型在推理能力上相比ChatGPT 還差很遠，他們的目標：我們計劃今年10月底整體趕超ChatGPT。到時繼續測試這三個問題來檢測，期待他們能夠去實現這一目標。

訊飛星火大模型 與New Bing實測對比