pcm是什麼檔案

2023-03-10 18:00:31

pcm是一種多媒體音訊檔,被廣泛用於素材儲存及音樂欣賞;PCM檔案能夠一邊讀一邊播放,而不需要把這個檔案全部讀出後然後回放,這樣就可以做到不用下載 就可以實現收聽了。PCM被稱為脈碼編碼調變,PCM中的聲音資料沒有被壓縮,它是由模擬訊號經過取樣、量化、編碼轉換成的標準的數位音訊資料。

本教學操作環境:windows7系統、Dell G3電腦。

一、名詞解析

PCM(Pulse Code Modulation)也被稱為脈碼編碼調變,PCM中的聲音資料沒有被壓縮,它是由模擬訊號經過取樣、量化、編碼轉換成的標準的數位音訊資料。取樣轉換方式參考下圖進行了解:

1.png

音訊取樣包含以下幾大要素:

1. 取樣率

取樣率表示音訊訊號每秒的數位快照數。該速率決定了音訊檔的頻率範圍。取樣率越高,數位波形的形狀越接近原始模擬波形。低取樣率會限制可錄製的頻率範圍,這可導致錄音表現原始聲音的效果不佳。根據奈奎斯特取樣定理,為了重現給定頻率,取樣率必須至少是該頻率的兩倍。例如,一般CD唱片的取樣率為每秒 44,100 個取樣,因此可重現最高為 22,050 Hz 的頻率,此頻率剛好超過人類的聽力極限 20,000 Hz。

2.png

圖中A是低取樣率的音訊訊號,其效果已經將原始聲波進行了扭曲,B則是完全重現原始聲波的高取樣率的音訊訊號。

數位音訊常用的取樣率如下:

3.png

2. 位深度

位深度決定動態範圍。取樣聲波時,為每個取樣指定最接近原始聲波振幅的振幅值。較高的位深度可提供更多可能的振幅值,產生更大的動態範圍、更低的噪聲基準和更高的保真度。

4.png

位深度越高,提供的動態範圍越大。

二、PCM

在上面的名詞解析中我們應該對PCM有了一定的理解和認識,下面我們將對PCM做更多的講解。

PCM檔案具有串流媒體特性,是數位通訊的編碼方式之一。

PCM檔案被廣泛用於素材儲存及音樂欣賞,CD、DVD以及我們常見的 WAV檔案中均有應用,PCM檔案能夠一邊讀一邊播放,而不需要把這個檔案全部讀出後然後回放,這樣就可以做到不用下載 就可以實現收聽了。

1. PCM音訊資料儲存方式

如果是單聲道的檔案,取樣資料按時間的先後順序依次存入。如果是單聲道的音訊檔,取樣資料按時間的先後順序依次存入(也可能採用 LRLRLR 方式儲存,只是另一個聲道的資料為 0)。

如果是雙聲道的話通常按照 LRLRLR 的方式儲存,儲存的時候還和機器的大小端有關。

PCM的儲存方式為小端模式,儲存Data資料排列如下圖所示:

5.png

2. PCM 音訊資料的引數

描述 PCM 音訊資料的引數的時候有如下描述方式:

44100HZ 16bit stereo: 每秒鐘有 44100 次取樣, 取樣資料用 16 位(2 位元組)記錄, 雙聲道(立體聲)
22050HZ 8bit  mono: 每秒鐘有 22050 次取樣, 取樣資料用 8 位(1 位元組)記錄, 單聲道
48000HZ 32bit 51ch: 每秒鐘有 48000 次取樣, 取樣資料用 32 位(4 位元組浮點型)記錄, 5.1 聲道
登入後複製

44100Hz 指的是取樣率,它的意思是每秒取樣 44100 次。取樣率越大,儲存數位音訊所佔的空間就越大。

16bit 指的是取樣精度,意思是原始模擬訊號被取樣後,每一個取樣點在計算機中用 16 位(兩個位元組)來表示。取樣精度越高越能精細地表示模擬訊號的差異。

Stereo 指的是聲道數,也即取樣時用到的麥克風的數量,麥克風越多就越能還原真實的取樣環境(當然麥克風的放置位置也是有規定的)。

3. PCM檔案格式簡介

PCM檔案:模擬音訊訊號經模數轉換(A/D變換)直接形成的二進位制序列,該檔案沒有附加的檔案頭和檔案結束標誌。Windows的Convert工具可以把PCM音訊格式的檔案轉換成Microsoft的WAV格式的檔案。

將音訊數位化,其實就是將聲音數位化。最常見的方式是透過脈衝編碼調變PCM(Pulse Code Modulation) 。運作原理如下:首先我們考慮聲音經過麥克風,轉換成一連串電壓變化的訊號,如下圖所示。這張圖的橫座標為秒,縱座標為電壓大小。要將這樣的訊號轉為 PCM 格式的方法,是使用三個引數來表示聲音,它們是:聲道數、取樣位數和取樣頻率。

6.png

  • 取樣頻率:即取樣頻率,指每秒鐘取得聲音樣本的次數。取樣頻率越高,聲音的品質也就越好,聲音的還原也就越真實,但同時它佔的資源比較多。由於人耳的解析度很有限,太高的頻率並不能分辨出來。在16位母音效卡中有22KHz、44KHz等幾級,其中,22KHz相當於普通FM廣播的音質,44KHz已相當於CD音質了,目前的常用取樣頻率都不超過48KHz。

  • 取樣位數:即取樣值或取樣值(就是將取樣樣本幅度量化)。它是用來衡量聲音波動變化的一個引數,也可以說是音效卡的解析度。它的數值越大,解析度也就越高,所發出聲音的能力越強。

  • 聲道數:很好理解,有單聲道和立體聲之分,單聲道的聲音只能使用一個喇叭發聲(有的也處理成兩個喇叭輸出同一個聲道的聲音),立體聲的PCM 可以使兩個喇叭都發聲(一般左右聲道有分工) ,更能感受到空間效果。

下面再用圖解來看看取樣位數和取樣頻率的概念。讓我們來看看這幾幅圖。圖中的黑色曲線表示的是PCM 檔案錄製的自然界的聲波,紅色曲線表示的是PCM 檔案輸出的聲波,橫座標便是取樣頻率;縱座標便是取樣位數。這幾幅圖中的格子從左到右,逐漸加密,先是加大橫座標的密度,然後加大縱座標的密度。顯然,當橫座標的單位越小即兩個取樣時刻的間隔越小,則越有利於保持原始聲音的真實情況,換句話說,取樣的頻率越大則音質越有保證;同理,當縱座標的單位越小則越有利於音質的提高,即取樣的位數越大越好。

7.png

在計算機中取樣位數一般有8位元和16位元之分,但有一點請大家注意,8位元不是說把縱座標分成8份,而是分成2的8次方即256份; 同理16位元是把縱座標分成2的16次方65536份; 而取樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。

8.png

那麼,現在我們就可以得到PCM檔案所佔容量的公式:儲存量 = (取樣頻率*取樣位數*聲道)*時間/8(單位:位元組數).

例如,數位鐳射唱盤(CD-DA,紅皮書標準)的標準取樣頻率為44.lkHz,取樣數位為16位元,立體聲(2聲道),可以幾乎無失真地播出頻率高達22kHz的聲音,這也是人類所能聽到的最高頻率聲音。鐳射唱盤一分鐘音樂需要的儲存量為:     

(44.1*1000*l6*2)*60/8=10,584,000(位元組)=10.584MBytes
登入後複製

這個數值就是PCM聲音檔案在硬碟中所佔磁碟空間的儲存量。

計算機音訊檔的格式決定了其聲音的品質,日常生活中電話、收音機等均為模擬音訊訊號,即不存在取樣頻率和取樣位數的概念,我們可以這樣比較一下:

  • 44KHz,16BIT的聲音稱作:CD音質;

  • 22KHz、16Bit的聲音效果近似於立體聲(FM Stereo)廣播,稱作:廣播音質;

  • 11kHz、8Bit的聲音,稱作:電話音質。

微軟的WAV檔案就是PCM編碼的一種。

擴充套件知識:與PCM檔案相關的其他檔案型別

延期檔案型別開發人員檔案類別檔案型別描述
.SMIApple磁碟映像檔案Self-Mounting Disk Image
.AC3Various Developers音訊檔Audio Codec 3 File
.DVRoxio視訊檔Digital Video File
.YUVWinXMedia Software視訊檔YUV Video File
.MJP2Open Source視訊檔Motion JPEG 2000 Video
.MP4VMoving Picture Experts Group視訊檔MPEG-4 Video File
.MP4Moving Picture Experts Group視訊檔MPEG-4 Video File
.IVFIntel Corporation視訊檔Indeo Video Format File
.IFVIntel Corporation視訊檔Indeo Video Format File
.3GPPVarious Developers視訊檔3GPP Media File

更多相關知識,請存取欄目!

以上就是pcm是什麼檔案的詳細內容,更多請關注TW511.COM其它相關文章!