91精品一区二区三区久久久久久_欧美一级特黄大片色_欧美一区二区人人喊爽_精品一区二区三区av

位置:51電子網 » 技術資料 » 測試測量

采用DSP內核技術進行語音壓縮開發

發布時間:2008/5/26 0:00:00 訪問次數:833

作者:南京解放軍理工大學氣象學院大氣探測系(211101) 翟東力 王曉蕾

來源:《電子技術應用》

摘要:介紹了一種采用dsp內核芯片設計開發的手持式語音設備。該語音設備無需開發系統支持,語音播放時間長達200分鐘,而壓縮比達到46:1,僅使用一片32兆位的閃速存儲器就可保存全部數據。 關鍵詞:dsp內核 語音壓縮

隨著儀器儀表人機界面越來越趨于人性化,語音識別的需求不斷增長,語音處理技術發展迅速,各種處理算法層出不窮,為大容量的語音應用提供了愈加靈活的技術手段。然而,語音數據的壓縮比越高,數據回放算法所要求的計算能力也越強。目前,大多數高壓縮比的語音壓縮數據生成必須采用專用的語音開發工具和開發版權,這給國內的小規模用戶造成了一定的困難。在8k的采樣速率下,同樣是使用4兆位的flash芯片來存儲數據,不同的語音算法所能提供的回放時間有很大差異。例如,采用adpcm(自適應增量脈沖編碼)算法只可提供128秒的回放時間,而采用ti的lpc(線性預測編碼)算法卻可得到50分鐘的回放時間。在某一工程項目中,我們需要開發一種回放時間長達200分鐘的低成本手持語音設備,由于使用了dsp內核芯片,在較短的時間內完成了開發工作,達到了預先提出的性能指標。

1 語音算法與芯片特點

在本項目中,我們選擇了dsp集團的語音壓縮最新算法triple rate coder,其壓縮比達到了46:1,且音質良好,mos指標達到了3.98。

該算法的基本思想是:首先將語音分為若干小段,由于語音信號的譜變化是一個緩變量,因此在每一小段內信號是平穩變化的。然后用一個數字濾波器和一個激勵函數來表示這一段時域波形的離散采樣序列。在實際算法中是采用了一個十階的線性預測濾波器,計算時還將每一幀分為4個子幀,每一子幀的濾波器系數矢量由上一幀和本幀數據計算得到,而最后一子幀的濾波器系數矢量則由矢量分解預測法得到;激勵函數采用的是偽隨機多脈沖激勵函數,由最大似然算法得到。對每一幀計算得到濾波器系數矢量和函數生成元后,將這些系數再壓縮打包就得到了最后的語音壓縮數據。當對語音壓縮數據進行解壓時,首先將打包的數據展開,然后建立起線性預測濾波器,將重新生成的偽隨機多脈沖激勵函數輸入濾波器,這樣在濾波器的輸出端就可得到被恢復的語音信號序列了。

該算法的實時運算需要22mips以上的運算速度,為此dsp集團將dsp內核和算法代碼集成在d6571系列芯片內,以滿足除pc用戶以外的更廣泛應用。d6571原理框圖如圖1所示,其本身可直接外掛并管理4兆位的flash,8k采樣速率時在2.8kb的數據率下可提供25分鐘的回放時間。該芯片具備工業標準的編***接口,可直接與串行pcm接口的音頻編解碼芯片相連,如美國國家半導體的tp3054或韓國三星半導體的ks8620。d6571可外接兩片音頻編解碼芯片,上電后可用設置命令對外接音頻編解碼芯片的工作模式進行設置。例如:設置外接芯片的時鐘是外同步還是自同步;設置外接芯片處于輸出方式還是輸入方式等。

根據實際開發經驗,我們認為d6571芯片與其它公司所提供的某些dsp內核芯片相比,其最大的優點是幾乎不需要任何開發工具或軟件就可使用。因為該芯片的數據是雙向的,既可由上位機將壓縮后的語音數據通過它解壓轉變成語音,也可輸入語音通過它進行實時壓縮后傳送給上位機。這就大大方便了長回放時間語音開發用戶的使用。更何況目前許多語音壓縮芯片對語音數據的管理是不公開的,例如:某些數字錄音電話的語音壓縮芯片。

2 系統構成

與語音處理有關的系統構成如圖2所示。

語音數據存放在一片32兆位的flash中,采用三星的k29w3200,這是一種8位并行接口的閃存,并行接口有利于提高

作者:南京解放軍理工大學氣象學院大氣探測系(211101) 翟東力 王曉蕾

來源:《電子技術應用》

摘要:介紹了一種采用dsp內核芯片設計開發的手持式語音設備。該語音設備無需開發系統支持,語音播放時間長達200分鐘,而壓縮比達到46:1,僅使用一片32兆位的閃速存儲器就可保存全部數據。 關鍵詞:dsp內核 語音壓縮

隨著儀器儀表人機界面越來越趨于人性化,語音識別的需求不斷增長,語音處理技術發展迅速,各種處理算法層出不窮,為大容量的語音應用提供了愈加靈活的技術手段。然而,語音數據的壓縮比越高,數據回放算法所要求的計算能力也越強。目前,大多數高壓縮比的語音壓縮數據生成必須采用專用的語音開發工具和開發版權,這給國內的小規模用戶造成了一定的困難。在8k的采樣速率下,同樣是使用4兆位的flash芯片來存儲數據,不同的語音算法所能提供的回放時間有很大差異。例如,采用adpcm(自適應增量脈沖編碼)算法只可提供128秒的回放時間,而采用ti的lpc(線性預測編碼)算法卻可得到50分鐘的回放時間。在某一工程項目中,我們需要開發一種回放時間長達200分鐘的低成本手持語音設備,由于使用了dsp內核芯片,在較短的時間內完成了開發工作,達到了預先提出的性能指標。

1 語音算法與芯片特點

在本項目中,我們選擇了dsp集團的語音壓縮最新算法triple rate coder,其壓縮比達到了46:1,且音質良好,mos指標達到了3.98。

該算法的基本思想是:首先將語音分為若干小段,由于語音信號的譜變化是一個緩變量,因此在每一小段內信號是平穩變化的。然后用一個數字濾波器和一個激勵函數來表示這一段時域波形的離散采樣序列。在實際算法中是采用了一個十階的線性預測濾波器,計算時還將每一幀分為4個子幀,每一子幀的濾波器系數矢量由上一幀和本幀數據計算得到,而最后一子幀的濾波器系數矢量則由矢量分解預測法得到;激勵函數采用的是偽隨機多脈沖激勵函數,由最大似然算法得到。對每一幀計算得到濾波器系數矢量和函數生成元后,將這些系數再壓縮打包就得到了最后的語音壓縮數據。當對語音壓縮數據進行解壓時,首先將打包的數據展開,然后建立起線性預測濾波器,將重新生成的偽隨機多脈沖激勵函數輸入濾波器,這樣在濾波器的輸出端就可得到被恢復的語音信號序列了。

該算法的實時運算需要22mips以上的運算速度,為此dsp集團將dsp內核和算法代碼集成在d6571系列芯片內,以滿足除pc用戶以外的更廣泛應用。d6571原理框圖如圖1所示,其本身可直接外掛并管理4兆位的flash,8k采樣速率時在2.8kb的數據率下可提供25分鐘的回放時間。該芯片具備工業標準的編***接口,可直接與串行pcm接口的音頻編解碼芯片相連,如美國國家半導體的tp3054或韓國三星半導體的ks8620。d6571可外接兩片音頻編解碼芯片,上電后可用設置命令對外接音頻編解碼芯片的工作模式進行設置。例如:設置外接芯片的時鐘是外同步還是自同步;設置外接芯片處于輸出方式還是輸入方式等。

根據實際開發經驗,我們認為d6571芯片與其它公司所提供的某些dsp內核芯片相比,其最大的優點是幾乎不需要任何開發工具或軟件就可使用。因為該芯片的數據是雙向的,既可由上位機將壓縮后的語音數據通過它解壓轉變成語音,也可輸入語音通過它進行實時壓縮后傳送給上位機。這就大大方便了長回放時間語音開發用戶的使用。更何況目前許多語音壓縮芯片對語音數據的管理是不公開的,例如:某些數字錄音電話的語音壓縮芯片。

2 系統構成

與語音處理有關的系統構成如圖2所示。

語音數據存放在一片32兆位的flash中,采用三星的k29w3200,這是一種8位并行接口的閃存,并行接口有利于提高

相關IC型號

熱門點擊

 

推薦技術資料

音頻變壓器DIY
    筆者在本刊今年第六期上著重介紹了“四夾三”音頻變壓器的... [詳細]
版權所有:51dzw.COM
深圳服務熱線:13692101218  13751165337
粵ICP備09112631號-6(miitbeian.gov.cn)
公網安備44030402000607
深圳市碧威特網絡技術有限公司
付款方式


 復制成功!
长寿区| 若羌县| 理塘县| 炎陵县| 宁河县| 剑川县| 罗城| 郧西县| 天等县| 沛县| 鹤庆县| 永新县| 刚察县| 泸定县| 新民市| 昌宁县| 石景山区| 象州县| 肥乡县| 北流市| 治多县| 松江区| 东山县| 新兴县| 永福县| 会昌县| 宜阳县| 太仓市| 长泰县| 桦川县| 杭锦旗| 黄大仙区| 花莲县| 万盛区| 清流县| 天镇县| 石屏县| 南城县| 石棉县| 凤台县| 宁强县|