音頻編碼過程
發布時間:2008/12/30 0:00:00 訪問次數:1190
1.音頻信號數字化
信號的數字化就是將連續的模擬信號轉換成離散的數字信號,一般需要完成采樣、量化和編碼三個步驟,如圖1所示。采 樣是指用每隔一定時間間隔的信號樣本值序列來代替原來在時間上連續的信號。量化是用有限個幅度近似表示原來在時間上 連續變化的幅度值,把模擬信號的連續幅度變為有限數量、有一定時間間隔的離散值。編碼則是按照一定的規律,把量化后 的離散值用二進制數碼表示。上述數字化的過程又稱為脈沖編碼調制(pulse code modulation),通常由a/d轉換器來實現 。
圖1 音頻信號數字化
數字音頻信號經過處理、記錄或傳輸后,當需要重現聲音時,還必須還原為連續變化的模擬信號。將數字信號轉換成模擬 信號為d/a變換。
數字音頻的質量取決于采樣頻率和量化位數。采樣頻率越高,量化位數越多,數字化后的音頻質量越高。
2.音頻采樣
采樣就是從一個時間上連續變化的模擬信號取出若干個有代表性的樣本值,來代表這個連續變化的模擬信號。一個在時間 和幅值上都連續的模擬音頻信號的函數表示為x(t),采樣的過程就是在時間上將函數x(t)離散化的過程。一般的采樣是按均 勻的時間間隔進行的。設這一時間間隔為t,則取樣后的信號為x(nt),n為自然數。
根據奈奎斯特采樣定理:要從采樣值序列完全恢復原始的波形,采樣頻率必須大于或等于原始信號最高頻率的2倍。設連 續信號x(t)的頻譜為x(f),以采樣間隔時間t抽樣得到離散信號x(nt),如果滿足|f|≤fc時,其中fc是截止頻率,即t≤ 1/2f,時,可以由x(nt)完全確定連續信號x(f):
當采樣頻率為1/2t時。即fn=1/2t時,稱fn為佘奎斯特采樣頻率.
3.音頻量化
采樣把模擬信號變成了時間上離散的樣值序列,但每個樣值的幅度仍然是一個連續的模擬量,因此還必須對其進行離散化 處理,將其轉換為有限個離散值,才能最終與數碼來表示其幅值。量化過程是將采樣值在幅度上再進行離散化處理的過程。 所有的采樣值可能出現的范圍被劃分成有限多個量化階的集合,把凡是落入某個量化階內的采樣值都賦予相同的值,即量化 值。通常這個量化值用二進制來表示,用n位二進制碼字可以表示2n個不同的量化電平。存儲數字音頻信號的比特率為:
i=n.fs
其中的fs是采樣率,n是每個采樣值的比特數。
表示采樣值的二進制的位數為量化位數,它反映出各采樣值的精度,如3位能表示采樣值的8個等級,8位能反映256個等級 ,其精度為音頻信號最大振幅的1/256。量化位數越多,量化值越接近于采樣值,其精度越高,但要求的信息存儲量就越大 。
根據公式(30-3)可知,要減小比特率i,在fs已經確定的情況下,只能去減少n的值。n的值降低會導致量化的精度降低 ,n的值增加又會導致信息存儲量的增加。因此在編碼時就需要合理地選擇n的值。
均勻量化就是采用相等的量化間隔進行采樣,也稱為線性量化。用均勻量化來量化輸入信號時,無論對大的輸入信號還是 小的輸入信號都一律采用相同的量化間隔。因此,要想既適應幅度大的輸入信號,同時又要滿足精度高的要求,就需要增加 采樣樣本的位數。
非均勻量化的基本思想是對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,這 樣就可以在滿足精度要求的情況下使用較少的位數來表示。其中采樣輸入信號幅度和量化輸出數據之間一般定義了兩種對應 關系,一種稱為u律壓縮算法,另一種稱為a律壓縮算法。
采用不同的量化方法,量化后的數據量也就不同。因此說量化也是一種壓縮數據的方法。
4.音頻編碼
采樣、量化后的信號還不是數字信號,需要把它轉換成數字脈沖,這一過程稱為編碼。最簡單的編碼方式是二進制編碼。 具體說就是用溝比特的二進制編碼來表示己經量化了的樣值,每個二進制數對應一個量化電平,然后把它們排列,得到由二 值脈沖串組成的數字信息流。用這樣方式組成的二值脈沖的頻率等于采樣頻率與量化比特數的乘積,稱為數字信號的數碼率 。采樣頻率越高,量化比特數越大,數碼率就越高,所需要的傳輸帶寬就越寬。
音頻編碼方法歸納起來可以分成三大類:波形編碼、參數編碼、混合編碼。波形編碼是盡量保持輸入波形不變,即重建的 語音信號基本上與原始語音信號波形相同,壓縮比較低;參數編碼是要求重建的信號聽起來與輸入語音一樣,但其波形可以 不同,它是以語音信號所產生的數學模型為基礎∷的一種編碼方法,壓縮比較高;混合編碼是綜合了波形編碼的高質量潛力和參數編碼的高壓縮效率的混合編碼的方法,這類方法也是目前低碼率編碼的方向。
歡迎轉載,信息來
1.音頻信號數字化
信號的數字化就是將連續的模擬信號轉換成離散的數字信號,一般需要完成采樣、量化和編碼三個步驟,如圖1所示。采 樣是指用每隔一定時間間隔的信號樣本值序列來代替原來在時間上連續的信號。量化是用有限個幅度近似表示原來在時間上 連續變化的幅度值,把模擬信號的連續幅度變為有限數量、有一定時間間隔的離散值。編碼則是按照一定的規律,把量化后 的離散值用二進制數碼表示。上述數字化的過程又稱為脈沖編碼調制(pulse code modulation),通常由a/d轉換器來實現 。
圖1 音頻信號數字化
數字音頻信號經過處理、記錄或傳輸后,當需要重現聲音時,還必須還原為連續變化的模擬信號。將數字信號轉換成模擬 信號為d/a變換。
數字音頻的質量取決于采樣頻率和量化位數。采樣頻率越高,量化位數越多,數字化后的音頻質量越高。
2.音頻采樣
采樣就是從一個時間上連續變化的模擬信號取出若干個有代表性的樣本值,來代表這個連續變化的模擬信號。一個在時間 和幅值上都連續的模擬音頻信號的函數表示為x(t),采樣的過程就是在時間上將函數x(t)離散化的過程。一般的采樣是按均 勻的時間間隔進行的。設這一時間間隔為t,則取樣后的信號為x(nt),n為自然數。
根據奈奎斯特采樣定理:要從采樣值序列完全恢復原始的波形,采樣頻率必須大于或等于原始信號最高頻率的2倍。設連 續信號x(t)的頻譜為x(f),以采樣間隔時間t抽樣得到離散信號x(nt),如果滿足|f|≤fc時,其中fc是截止頻率,即t≤ 1/2f,時,可以由x(nt)完全確定連續信號x(f):
當采樣頻率為1/2t時。即fn=1/2t時,稱fn為佘奎斯特采樣頻率.
3.音頻量化
采樣把模擬信號變成了時間上離散的樣值序列,但每個樣值的幅度仍然是一個連續的模擬量,因此還必須對其進行離散化 處理,將其轉換為有限個離散值,才能最終與數碼來表示其幅值。量化過程是將采樣值在幅度上再進行離散化處理的過程。 所有的采樣值可能出現的范圍被劃分成有限多個量化階的集合,把凡是落入某個量化階內的采樣值都賦予相同的值,即量化 值。通常這個量化值用二進制來表示,用n位二進制碼字可以表示2n個不同的量化電平。存儲數字音頻信號的比特率為:
i=n.fs
其中的fs是采樣率,n是每個采樣值的比特數。
表示采樣值的二進制的位數為量化位數,它反映出各采樣值的精度,如3位能表示采樣值的8個等級,8位能反映256個等級 ,其精度為音頻信號最大振幅的1/256。量化位數越多,量化值越接近于采樣值,其精度越高,但要求的信息存儲量就越大 。
根據公式(30-3)可知,要減小比特率i,在fs已經確定的情況下,只能去減少n的值。n的值降低會導致量化的精度降低 ,n的值增加又會導致信息存儲量的增加。因此在編碼時就需要合理地選擇n的值。
均勻量化就是采用相等的量化間隔進行采樣,也稱為線性量化。用均勻量化來量化輸入信號時,無論對大的輸入信號還是 小的輸入信號都一律采用相同的量化間隔。因此,要想既適應幅度大的輸入信號,同時又要滿足精度高的要求,就需要增加 采樣樣本的位數。
非均勻量化的基本思想是對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,這 樣就可以在滿足精度要求的情況下使用較少的位數來表示。其中采樣輸入信號幅度和量化輸出數據之間一般定義了兩種對應 關系,一種稱為u律壓縮算法,另一種稱為a律壓縮算法。
采用不同的量化方法,量化后的數據量也就不同。因此說量化也是一種壓縮數據的方法。
4.音頻編碼
采樣、量化后的信號還不是數字信號,需要把它轉換成數字脈沖,這一過程稱為編碼。最簡單的編碼方式是二進制編碼。 具體說就是用溝比特的二進制編碼來表示己經量化了的樣值,每個二進制數對應一個量化電平,然后把它們排列,得到由二 值脈沖串組成的數字信息流。用這樣方式組成的二值脈沖的頻率等于采樣頻率與量化比特數的乘積,稱為數字信號的數碼率 。采樣頻率越高,量化比特數越大,數碼率就越高,所需要的傳輸帶寬就越寬。
音頻編碼方法歸納起來可以分成三大類:波形編碼、參數編碼、混合編碼。波形編碼是盡量保持輸入波形不變,即重建的 語音信號基本上與原始語音信號波形相同,壓縮比較低;參數編碼是要求重建的信號聽起來與輸入語音一樣,但其波形可以 不同,它是以語音信號所產生的數學模型為基礎∷的一種編碼方法,壓縮比較高;混合編碼是綜合了波形編碼的高質量潛力和參數編碼的高壓縮效率的混合編碼的方法,這類方法也是目前低碼率編碼的方向。
歡迎轉載,信息來
熱門點擊