EMG在語音信號識別中的應用
發布時間:2007/4/23 0:00:00 訪問次數:1132
本文使用表面肌電信號(EMG)的語音信號識別系統改善噪聲條件下的聲音性能或幫助發音障礙的人。有些人發音有障礙,但講話時面部肌肉與正常人有同樣的動作模式,這樣使用表面肌電信號能幫助這些發音障礙的人發出簡單的指令,用來交流。
1 原理和方法
本研究只使用肌電信號的信息識別孤立的單詞、(0~9)十個數字。使用腦電圖儀EEG-1100K(electroen-cephalograph,EEG)采集肌電信號,采用雙極導聯模式,采樣頻率1000Hz。使用(0~9)十個單詞做試驗。在實驗中,受試者每10s重復詞匯表中的單詞,每個單詞重復10次。受試者以相似的方式重復講每個單詞,保持音量和快速最小變化。
表面肌電信號從五組面部肌肉中采樣,五路信號如圖1所示。提肌口(LAI)、顴肌部分(ZYG)、頸闊肌(PLT)、壓板口(DAO)、二腹的前面腹部(ABD)。使用五對表面電極采集肌電信號,每個電極用電極膏改進電極—皮膚界面,降低電阻。參考電極放在鼻根部。圖2是部分數據(0~3)的五路肌電信號(通道LAI、ZYG、PLT、DAO、ABD)時序圖。
肌電信號分析,首先對采集的信號進行預處理,端點檢測。再使用短時傅里葉變換(STFT)處理數據,提取特征量。通過主成分分析(PCA)減少這些特征集系數的維度。5個肌電通道每個都保留6個PCA系數,這樣一共有30個特征量。使用線性判別分析分類器分類(0~9)十個數字。表面肌電信號中語音識別系統的構成如圖3所示。
2 特征量提取
肌電信號本質上是具有非平穩定特性的生理電信號,時頻分析是研究非平衡信號的一種有效方法。該方法在時頻面上表述信號的時變特征,能夠更清晰地反映出信號的頻率特性隨時間的變化。本研究使用短時傅里葉變換方法對講不同詞的肌電信號進行分析,由于變換后特征向量的維度很高,為了成功的分類需要采用合適的降維方法,本文通過主成分分析PCA(Principal Component Analysis)減少這些征集系數的維度。
2.1 短時傅里葉變換
短時傅里葉變換基本原理:把信號劃分成許多小的時間間隔,分析每一個時間間隔,確每個間隔存在的頻率,頻譜的總體表示頻譜在時間上的變化。
信號s(t)短時傅里葉變換定義為:
2.2 主成分分析(PCA)
主成分分析(PCA)是總結多變量分析屬性的方法,經常用于特片提取或數字壓縮上的線性變換。在統計模式識別方面,主成分分析提供降低維度的有效方式,有效地減少特片系數表示的數量。PCA是把特征映射到特征向量上,保留那些最大的特征值。
p維隨機向量x的n次采樣值構成樣本陣X(n×p),n個p維列向量zi構成矩陣Z,如式(1)。
Z=XT=(z1 z2 …zp) (1)
式中T=(t1 t2 … tp)為正交陣,其列向量ti為樣本方差矩陣的特征值λi所對應的單位特征向量,且有λ1≥λ2…≥λp,則z1,z2,…,zp分別為樣本陣X的第1主成分,第2主部分,…,第p主成分,而且主成分z1表達了x最主要的信息,Z2表達了x次主要的信息,依次類推,前m個主成分一起表達x的主要特征。
3 特征分類
對肌電信號中的語音識別來說,特征提取是基礎,有效地進行分類是關鍵。本文的模式識別分類要用線性判別分類LDA(linear discriminant analysis),分類(0~9)十個數字。
線性判別分析,亦稱為Fisher線性判別,是較常用的方法。Fisher準則函數就是為了發現使得樣本類間離散度和樣本類內離散度的比值最大的投影方向。即在一投影方向上,同一個類的樣本聚集在一起,而不同類的樣本相對比較分散。
樣本類間隔散度矩陣定義為:
EMG在語音信號識別中的應用 [日期:2005-5-16] 來源:電子技術應用 作者:戴立梅 姚曉東 王 蓓 鄒俊忠 王行愚 [字體:無線電通信和飛行導航,但飛行艙內是高噪聲的環境,聲學噪聲能掩蓋飛行員的所有口頭講話,嚴重降低了常規的語音識別系統的準確度和性能,在飛行艙內使用面部肌電信號能提高語音識別性能。
本文使用表面肌電信號(EMG)的語音信號識別系統改善噪聲條件下的聲音性能或幫助發音障礙的人。有些人發音有障礙,但講話時面部肌肉與正常人有同樣的動作模式,這樣使用表面肌電信號能幫助這些發音障礙的人發出簡單的指令,用來交流。
1 原理和方法
本研究只使用肌電信號的信息識別孤立的單詞、(0~9)十個數字。使用腦電圖儀EEG-1100K(electroen-cephalograph,EEG)采集肌電信號,采用雙極導聯模式,采樣頻率1000Hz。使用(0~9)十個單詞做試驗。在實驗中,受試者每10s重復詞匯表中的單詞,每個單詞重復10次。受試者以相似的方式重復講每個單詞,保持音量和快速最小變化。
表面肌電信號從五組面部肌肉中采樣,五路信號如圖1所示。提肌口(LAI)、顴肌部分(ZYG)、頸闊肌(PLT)、壓板口(DAO)、二腹的前面腹部(ABD)。使用五對表面電極采集肌電信號,每個電極用電極膏改進電極—皮膚界面,降低電阻。參考電極放在鼻根部。圖2是部分數據(0~3)的五路肌電信號(通道LAI、ZYG、PLT、DAO、ABD)時序圖。
肌電信號分析,首先對采集的信號進行預處理,端點檢測。再使用短時傅里葉變換(STFT)處理數據,提取特征量。通過主成分分析(PCA)減少這些特征集系數的維度。5個肌電通道每個都保留6個PCA系數,這樣一共有30個特征量。使用線性判別分析分類器分類(0~9)十個數字。表面肌電信號中語音識別系統的構成如圖3所示。
2 特征量提取
肌電信號本質上是具有非平穩定特性的生理電信號,時頻分析是研究非平衡信號的一種有效方法。該方法在時頻面上表述信號的時變特征,能夠更清晰地反映出信號的頻率特性隨時間的變化。本研究使用短時傅里葉變換方法對講不同詞的肌電信號進行分析,由于變換后特征向量的維度很高,為了成功的分類需要采用合適的降維方法,本文通過主成分分析PCA(Principal Component Analysis)減少這些征集系數的維度。
2.1 短時傅里葉變換
短時傅里葉變換基本原理:把信號劃分成許多小的時間間隔,分析每一個時間間隔,確每個間隔存在的頻率,頻譜的總體表示頻譜在時間上的變化。
信號s(t)短時傅里葉變換定義為:
2.2 主成分分析(PCA)
主成分分析(PCA)是總結多變量分析屬性的方法,經常用于特片提取或數字壓縮上的線性變換。在統計模式識別方面,主成分分析提供降低維度的有效方式,有效地減少特片系數表示的數量。PCA是把特征映射到特征向量上,保留那些最大的特征值。
p維隨機向量x的n次采樣值構成樣本陣X(n×p),n個p維列向量zi構成矩陣Z,如式(1)。
Z=XT=(z1 z2 …zp) (1)
式中T=(t1 t2 … tp)為正交陣,其列向量ti為樣本方差矩陣的特征值λi所對應的單位特征向量,且有λ1≥λ2…≥λp,則z1,z2,…,zp分別為樣本陣X的第1主成分,第2主部分,…,第p主成分,而且主成分z1表達了x最主要的信息,Z2表達了x次主要的信息,依次類推,前m個主成分一起表達x的主要特征。
3 特征分類
對肌電信號中的語音識別來說,特征提取是基礎,有效地進行分類是關鍵。本文的模式識別分類要用線性判別分類LDA(linear discriminant analysis),分類(0~9)十個數字。
線性判別分析,亦稱為Fisher線性判別,是較常用的方法。Fisher準則函數就是為了發現使得樣本類間離散度和樣本類內離散度的比值最大的投影方向。即在一投影方向上,同一個類的樣本聚集在一起,而不同類的樣本相對比較分散。
樣本類間隔散度矩陣定義為: