適于語音處理的SDA80D51芯片及其數字錄放音系統
發布時間:2008/5/26 0:00:00 訪問次數:886
來源:電子技術應用 作者:清華大學 柳 遠 劉 加 劉潤生
摘要:sda80d51 unispeech是infineon公司新推出的具有dsp和單片機雙核的芯片。介紹了該芯片的組成框圖及各功能模塊,并且用該芯片完成一個硬件系統,實現了語音的g.723.1編碼存儲和解碼放音。
關鍵詞:g.723.1 sigma-delta調制 前后臺
目前市場上有很多語音錄放系統,如錄放音玩具、錄音筆等,大多采用了單片機控制一個語音芯片,再接一個flash存儲器的結構。由于語音芯片都是固定的編碼算法,使得系統用途單一,不利于進一步改進,缺乏靈活性,如日本oki公司的msm6588只能完成adpcm編碼。
用sda80d51芯片實現的語音錄放音系統,系統硬件簡單、工作可靠。所有的編解碼算法都由軟件來完成,設計者可以編制自己的軟件,完成不同的功能。它既可以作為簡單的數字錄放音系統,也可以通過改變程序做語音識別、語音合成等多種系統。用途靈活、功能強大。該系統選用g.723.1語音編解碼算法來完成語音的錄放。
1 sda80d51芯片介紹sda80d51芯片是德國infineon公司生產的適合語音處理的芯片,它采用0.18μm工藝,核的工作電壓為1.8v,i/o電壓為3.3v,模擬codec部分電壓2.5v,功耗是150mw。該芯片相當于一個片上系統(soc),內部集成了許多功能模塊,如圖1所示。由于它集成了許多功能模塊,如圖1所示。由于它集成了許多功能塊,幾乎只需要一片芯片就能完成語音處理和系統控制。
該芯片含有兩個處理器,分別是16位dsp(oak)和8位mcu(m8051 e-warp)。m8051 e-warp核由美國mentor graphics公司設計,它是與一般8051兼容的mcu,具有很多的增強功能,最高工作速度可達50mips(million instruction per second),是目前為止最快的增強8051。傳統8051的一個機器周期是12個時鐘周期,而這個核心只需2個時鐘周期,速度傳統8051的6倍。許多指令都能在一個機器周期內完成。由于指令與8051兼容,使得程序員不用花許多時間學習新指令,而直接采用傳統的8051編程方式就行。芯片集成有jtag口,用mentor graphics公司的fs2(first silicon solutions)仿真器就可以實現在線仿真。
oak核是美國dsp group公司設計的16位低功耗、低電壓和高速定點dsp。采用雙金屬cmos,在0.6μm或0.5μm以下工藝生產。工作電壓范圍在2.7v~5.5v。在5v 80mhz工作條件下,消耗電流38ma;在3.3v 80mhz條件下,消耗電流25ma。該核采用harvard總線結構,工作速度可達100mips。
codec部分由i2s、adc和dac組成。i2s口可用來外接一些通用的模/數芯片。兩路的12位8khz采樣率的adc,可接峰峰值為1.03v的差分電壓。片內有數字agc,可放大0到42db(8檔,6db步長);模/數轉換采用sigma-delta調制技術并經過一度的換算,得到16bit的pcm碼流,送往處理器。兩路11位8khz采樣率的dac可軟件調節增益,可放大0到-18db(-6db步長)。所有codec部分可通過asi接口連到oak或m8051上。
sda80d51芯片還有i2c、spi和pwm接口模塊,可以通過m8051來控制。另外在不同版本的芯片上還有多達50到250之間的gpio(通用的輸入輸出口),這可以保證系統控制的靈活性。
該芯片最有特點的功能模塊是存儲器管理單元mmu(memory manage unit),它可以管理兩個核的存儲區映射。物理存儲器(ram或rom)被看成由多個塊組成,每個塊的大小在不同版本的芯片上定義是不同的,本系統中,塊的大小是16k字節(或8k節)。mmu既可以把塊(8k字)映射給oak的程序區或數據區,也可以把塊(16k字節)映射給m8051的程序區或數據區。這些完全由寫m8051的特殊功能寄存器來完成。存儲空間的自由掛接使得完成兩個核之間的數據轉換變得非常容易。此外,程序裝載和啟動也需要mmu的控制。
整個芯片的工作方式是m8051作為主控制芯片,完成對各種接口的控制和系統的配置。oak作為協處理器,完成語音編解碼算法等計算。兩個核之間還有兩個64字深的fifo。它們用于雙核通信。
2 g.723.1語音編解碼語音編解碼算法一般分為三類:波形編碼、參數編碼(聲碼器)和混合編碼。波形編碼技術是在不建立語音模型的情況下,直接對語音波形用編碼方式逼近,可有時域的脈沖編碼調制和變換域編碼;參數編碼是在一定的語音模型基礎上,在編碼端分析出該模型參數,并選擇適當的方式對其進行高效率的編碼,而在解碼端利用這些參數和語音模型,用合適的激勵源(excitation)重新合成語音;混合編碼則保留了參數編碼的語音模型的假定,又利用了波形編碼的準則優化激勵信號。
g.723.1算法屬于混合編碼。語音模型是基于線性預測理論的全極點模型。輸入是16bit的pcm碼流,然后采用
來源:電子技術應用 作者:清華大學 柳 遠 劉 加 劉潤生
摘要:sda80d51 unispeech是infineon公司新推出的具有dsp和單片機雙核的芯片。介紹了該芯片的組成框圖及各功能模塊,并且用該芯片完成一個硬件系統,實現了語音的g.723.1編碼存儲和解碼放音。
關鍵詞:g.723.1 sigma-delta調制 前后臺
目前市場上有很多語音錄放系統,如錄放音玩具、錄音筆等,大多采用了單片機控制一個語音芯片,再接一個flash存儲器的結構。由于語音芯片都是固定的編碼算法,使得系統用途單一,不利于進一步改進,缺乏靈活性,如日本oki公司的msm6588只能完成adpcm編碼。
用sda80d51芯片實現的語音錄放音系統,系統硬件簡單、工作可靠。所有的編解碼算法都由軟件來完成,設計者可以編制自己的軟件,完成不同的功能。它既可以作為簡單的數字錄放音系統,也可以通過改變程序做語音識別、語音合成等多種系統。用途靈活、功能強大。該系統選用g.723.1語音編解碼算法來完成語音的錄放。
1 sda80d51芯片介紹sda80d51芯片是德國infineon公司生產的適合語音處理的芯片,它采用0.18μm工藝,核的工作電壓為1.8v,i/o電壓為3.3v,模擬codec部分電壓2.5v,功耗是150mw。該芯片相當于一個片上系統(soc),內部集成了許多功能模塊,如圖1所示。由于它集成了許多功能模塊,如圖1所示。由于它集成了許多功能塊,幾乎只需要一片芯片就能完成語音處理和系統控制。
該芯片含有兩個處理器,分別是16位dsp(oak)和8位mcu(m8051 e-warp)。m8051 e-warp核由美國mentor graphics公司設計,它是與一般8051兼容的mcu,具有很多的增強功能,最高工作速度可達50mips(million instruction per second),是目前為止最快的增強8051。傳統8051的一個機器周期是12個時鐘周期,而這個核心只需2個時鐘周期,速度傳統8051的6倍。許多指令都能在一個機器周期內完成。由于指令與8051兼容,使得程序員不用花許多時間學習新指令,而直接采用傳統的8051編程方式就行。芯片集成有jtag口,用mentor graphics公司的fs2(first silicon solutions)仿真器就可以實現在線仿真。
oak核是美國dsp group公司設計的16位低功耗、低電壓和高速定點dsp。采用雙金屬cmos,在0.6μm或0.5μm以下工藝生產。工作電壓范圍在2.7v~5.5v。在5v 80mhz工作條件下,消耗電流38ma;在3.3v 80mhz條件下,消耗電流25ma。該核采用harvard總線結構,工作速度可達100mips。
codec部分由i2s、adc和dac組成。i2s口可用來外接一些通用的模/數芯片。兩路的12位8khz采樣率的adc,可接峰峰值為1.03v的差分電壓。片內有數字agc,可放大0到42db(8檔,6db步長);模/數轉換采用sigma-delta調制技術并經過一度的換算,得到16bit的pcm碼流,送往處理器。兩路11位8khz采樣率的dac可軟件調節增益,可放大0到-18db(-6db步長)。所有codec部分可通過asi接口連到oak或m8051上。
sda80d51芯片還有i2c、spi和pwm接口模塊,可以通過m8051來控制。另外在不同版本的芯片上還有多達50到250之間的gpio(通用的輸入輸出口),這可以保證系統控制的靈活性。
該芯片最有特點的功能模塊是存儲器管理單元mmu(memory manage unit),它可以管理兩個核的存儲區映射。物理存儲器(ram或rom)被看成由多個塊組成,每個塊的大小在不同版本的芯片上定義是不同的,本系統中,塊的大小是16k字節(或8k節)。mmu既可以把塊(8k字)映射給oak的程序區或數據區,也可以把塊(16k字節)映射給m8051的程序區或數據區。這些完全由寫m8051的特殊功能寄存器來完成。存儲空間的自由掛接使得完成兩個核之間的數據轉換變得非常容易。此外,程序裝載和啟動也需要mmu的控制。
整個芯片的工作方式是m8051作為主控制芯片,完成對各種接口的控制和系統的配置。oak作為協處理器,完成語音編解碼算法等計算。兩個核之間還有兩個64字深的fifo。它們用于雙核通信。
2 g.723.1語音編解碼語音編解碼算法一般分為三類:波形編碼、參數編碼(聲碼器)和混合編碼。波形編碼技術是在不建立語音模型的情況下,直接對語音波形用編碼方式逼近,可有時域的脈沖編碼調制和變換域編碼;參數編碼是在一定的語音模型基礎上,在編碼端分析出該模型參數,并選擇適當的方式對其進行高效率的編碼,而在解碼端利用這些參數和語音模型,用合適的激勵源(excitation)重新合成語音;混合編碼則保留了參數編碼的語音模型的假定,又利用了波形編碼的準則優化激勵信號。
g.723.1算法屬于混合編碼。語音模型是基于線性預測理論的全極點模型。輸入是16bit的pcm碼流,然后采用