新一代低成本、高性能的語音處理專用芯片—UniLite
發布時間:2008/5/27 0:00:00 訪問次數:794
    
    
    語音處理技術是下一代多模式交互的人機界面設計中的核心技術之一。隨著消費類電子產品中對于高性能、高穩健性的語音接口需求的快速增加,嵌入式語音處理技術快速發展。嵌入式語音處理系統在硬件上通常基于lsi、mcu、dsp等芯片方案,軟件上采用語音識別、語音合成、語音壓縮編解碼、回聲消除等技術,可以應用于手持設備、智能家電等多個領域,賦予這些設備人性化的交互方式和便利的使用方法;也可應用于益智類產品中,例如聲控玩具、語言教學設備;還可以應用于車載通信設備中實現人機交流,提供安全、便捷、高效的操控接口。
    
    目前,手機廠商推出的新款高檔手機中已經加入非特定人姓名撥號、低速率語音壓縮編解碼、回聲消除等語音處理的功能。然而,這些解決方案普遍存在不能同時兼顧性能和價格的弱點,不能滿足和適應集成化要求高、成本控制嚴格的嵌入式系統要求。
    
    基于unilite芯片的嵌入式語音處理綜合方案
    
    根據市場對嵌入式語音處理系統的需求,凌聲芯語音科技有限公司推出了新一代的低成本高性能嵌入式語音處理綜合方案。該方案基于語音處理專用芯片unilite,具有如下特點:
    
    1. 支持高性能中小詞匯量文本輸入的非特定人語音識別;
    
    2. 支持低速率語音壓縮,語音壓縮率在8kbps以下;
    
    3. 低成本,芯片的總成本控制在三美元以下;
    
    4. 低功耗,系統的平均功耗控制在100毫瓦以內;
    
    5. 基于soc架構,集成度和穩定性高;
    
    6. 系統具有較強的對外控制能力;
    
    7. 速度快,能滿足語音處理的實時性要求。
    
    unilite芯片結構和參考設計
    
    unilite芯片專為語音識別和語音處理應用領域設計,芯片采用高集成度的soc結構,以0.18um工藝制造。其核心處理器件是一顆16位高速定點dsp,運算速度最高可達104mips,承擔控制和運算的任務。這種簡化的單dsp系統結構,使得系統資源得到有效調配,降低了系統的整體功耗。片內集成了16kb的sram程序存儲器,用來存儲應用程序和驅動程序;12kb的sram數據存儲器,用來存儲系統運行時所需要的數據;32kb的rom程序存儲器,用來存儲語音識別以及語音壓縮的算法;20kb的rom數據存儲器,用于存儲語音處理算法中所用的常數表。
    
    這種ram與rom存儲器相結合的結構特點,在保證應用靈活性的同時大大降低了系統的整體成本。unilite芯片中還集成了一路codec通道,采用σ-δ調制方式,能夠在8/16khz的采樣頻率下得到12位線性量化的數據。這樣可根據具體應用的要求處理不同質量的語音或音頻信號。unilite還集成了16個gpio口和其它外圍通信設備接口。實現與外部存儲器,pc等外部設備的數據交換,提供與用戶間的輔助交互接口。unilite芯片結構如圖1所示。
    
    以unilite芯片作為核心處理器件構成系統,外部只需擴展flash存儲器、電源芯片、啟動芯片等少量芯片即可構成完整系統應用。圖2是以unilite芯片為核心的系統參考設計方案。其中:
    
    1. 電源模塊提供給系統三路穩定電源,分別為3.3v(20ma)、2.5v(20ma)、1.8v(60ma);
    
    2. 啟動管理模塊為unilite啟動所需的專用芯片;
    
    3. spi flash存儲器芯片為unilite工作必需的芯片,存儲程序和數據信息;
    
    4. nand flash存儲器芯片為系統選配芯片,可用于大容量存儲語音數據;
    
    5. 功放芯片為系統外接喇叭時所需器件。
    
    
    
    圖1:unilite芯片的結構框圖
&n
    
    
    語音處理技術是下一代多模式交互的人機界面設計中的核心技術之一。隨著消費類電子產品中對于高性能、高穩健性的語音接口需求的快速增加,嵌入式語音處理技術快速發展。嵌入式語音處理系統在硬件上通常基于lsi、mcu、dsp等芯片方案,軟件上采用語音識別、語音合成、語音壓縮編解碼、回聲消除等技術,可以應用于手持設備、智能家電等多個領域,賦予這些設備人性化的交互方式和便利的使用方法;也可應用于益智類產品中,例如聲控玩具、語言教學設備;還可以應用于車載通信設備中實現人機交流,提供安全、便捷、高效的操控接口。
    
    目前,手機廠商推出的新款高檔手機中已經加入非特定人姓名撥號、低速率語音壓縮編解碼、回聲消除等語音處理的功能。然而,這些解決方案普遍存在不能同時兼顧性能和價格的弱點,不能滿足和適應集成化要求高、成本控制嚴格的嵌入式系統要求。
    
    基于unilite芯片的嵌入式語音處理綜合方案
    
    根據市場對嵌入式語音處理系統的需求,凌聲芯語音科技有限公司推出了新一代的低成本高性能嵌入式語音處理綜合方案。該方案基于語音處理專用芯片unilite,具有如下特點:
    
    1. 支持高性能中小詞匯量文本輸入的非特定人語音識別;
    
    2. 支持低速率語音壓縮,語音壓縮率在8kbps以下;
    
    3. 低成本,芯片的總成本控制在三美元以下;
    
    4. 低功耗,系統的平均功耗控制在100毫瓦以內;
    
    5. 基于soc架構,集成度和穩定性高;
    
    6. 系統具有較強的對外控制能力;
    
    7. 速度快,能滿足語音處理的實時性要求。
    
    unilite芯片結構和參考設計
    
    unilite芯片專為語音識別和語音處理應用領域設計,芯片采用高集成度的soc結構,以0.18um工藝制造。其核心處理器件是一顆16位高速定點dsp,運算速度最高可達104mips,承擔控制和運算的任務。這種簡化的單dsp系統結構,使得系統資源得到有效調配,降低了系統的整體功耗。片內集成了16kb的sram程序存儲器,用來存儲應用程序和驅動程序;12kb的sram數據存儲器,用來存儲系統運行時所需要的數據;32kb的rom程序存儲器,用來存儲語音識別以及語音壓縮的算法;20kb的rom數據存儲器,用于存儲語音處理算法中所用的常數表。
    
    這種ram與rom存儲器相結合的結構特點,在保證應用靈活性的同時大大降低了系統的整體成本。unilite芯片中還集成了一路codec通道,采用σ-δ調制方式,能夠在8/16khz的采樣頻率下得到12位線性量化的數據。這樣可根據具體應用的要求處理不同質量的語音或音頻信號。unilite還集成了16個gpio口和其它外圍通信設備接口。實現與外部存儲器,pc等外部設備的數據交換,提供與用戶間的輔助交互接口。unilite芯片結構如圖1所示。
    
    以unilite芯片作為核心處理器件構成系統,外部只需擴展flash存儲器、電源芯片、啟動芯片等少量芯片即可構成完整系統應用。圖2是以unilite芯片為核心的系統參考設計方案。其中:
    
    1. 電源模塊提供給系統三路穩定電源,分別為3.3v(20ma)、2.5v(20ma)、1.8v(60ma);
    
    2. 啟動管理模塊為unilite啟動所需的專用芯片;
    
    3. spi flash存儲器芯片為unilite工作必需的芯片,存儲程序和數據信息;
    
    4. nand flash存儲器芯片為系統選配芯片,可用于大容量存儲語音數據;
    
    5. 功放芯片為系統外接喇叭時所需器件。
    
    
    
    圖1:unilite芯片的結構框圖
&n