基於百度AI平臺的語音識別功能開發-SDK呼叫

2020-11-13 17:00:50

一.前期工作

1.擁有一個百度智慧雲賬號
2.建立一個語音應用,建立成功後會顯示有一個應用

在這裡插入圖片描述3.在應用列表裡檢視自己的應用
在這裡插入圖片描述強調:
這裡的AppID、API Key、Secret Key 很重要
百度除了語音識別等其餘的api呼叫也離不開這三個重要的引數。

二、呼叫百度語音SDK,基於python3

操作流程:
1.下包
我使用的是pip install baidu-aip

在這裡插入圖片描述
2.新建AipSpeech

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

3.設定AipSpeech(一般不需要)

4.請求說明
以識別本地語音檔案為例,假設本地有個語音檔案是audio.pcm:

# 讀取檔案
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 識別本地檔案
client.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
    'dev_pid': 1537,
})

注意:
1.本地語音檔案的字尾名要和後面的引數一一對應
2.音訊的取樣率固定為16000/8000,不符合此取樣率的音訊識別不出來
3.語音檔案的格式支援pcm / wav / amr

// 成功返回
{
    "err_no": 0,
    "err_msg": "success.",
    "corpus_no": "15984125203285346378",
    "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
    "result": ["北京天氣"]
}

// 失敗返回
{
    "err_no": 2000,
    "err_msg": "data empty.",
    "sn": null
}

更多詳情請見
百度語音識別官網技術檔案(https://cloud.baidu.com/doc/SPEECH/s/1k4o0bmc7)