講演抄録/キーワード |
講演名 |
2008-07-17 13:30
残響に頑健な音声認識のための前処理:音声特有の特徴の利用 Rico Petric(ドレスデン工科大)・Xugang Lu・○鵜木祐史・赤木正人(北陸先端大)・Ruediger Hoffmann(ドレスデン工科大) SP2008-44 |
抄録 |
(和) |
本論文では,残響環境に頑健な音声認識のための二つの前処理法を提案する.従
来法では,残響除去を行うために室内インパルス応答をブラインド推定し,その
逆フィルタを適用する.これに対し,提案法は音声特有の特徴に基づき,残響に
頑健な特徴を利用する.一つのは,調波性に基づく特徴分析であり,もう一つの
方法は,時間的パワーエンベロープに関する特徴分析である.前者は,音声の調
波成分を利点を利用するものであり,後者は,音声明瞭度に関連する音韻レベル
の時間特性を表す音声の時間的な振幅変調を利用するものである.両方とも,異
なる方法で,著しく認識精度を高めることができる.これらを組み合わせた方法
は,更に,個々の方法利点を共有することができる.ここでは,残響環境下の音
声認識に対するこの組合せ法の有効性を調べるために,それぞれの方法と組合せ
法を,静音環境と残響環境それぞれのトレーニング後にテストした.その結果,
強残響環境においても,提案法が残響環境でのトレーニングに対して実用的な性
能を得ることがわかった.ここでは,残響時間,話者ーマイクロホン間距離を条
件として認識性能を評価したことが新しい点である. |
(英) |
This paper proposes two methods of robust automatic speech recognition (ASR) in reverberant environments. Unlike other methods that mostly apply inverse filtering by blindly estimated room impulse responses to achieve dereverberation, the proposed methods are based on the utilization of speech properties. The first method -- Harmonicity-based Feature Analysis -- takes advantage of the harmonic components of speech, which are assumed to be undistorted. The second method -- Temporal Power Envelope Feature Analysis -- utilizes the temporal modulation structure of speech, containing most intelligibility information. Both methods increase recognition remarkably in different ways. Combining them connects their individual advantages. To evaluate the effectiveness of utilizing harmonicity and the modulation temporal structure for reverberant ASR, the methods were tested using clean and reverberant training. As the results revealed, even under strong reverberant conditions both methods obtained practical recognition rate for reverberant training. In addition, to test their dependency on the reverberation time, the speaker-to-microphone distance was tested, which is also one of the main contributions in this paper. |
キーワード |
(和) |
残響 / ロバスト音声認識 / 調波性に基づく特徴分析 / 時間パワーエンベロープに / / / / |
(英) |
reverberation / robust ASR / harmonicity based feature analysis / temporal power envelope feature analysis / / / / |
文献情報 |
信学技報, vol. 108, no. 142, SP2008-44, pp. 7-12, 2008年7月. |
資料番号 |
SP2008-44 |
発行日 |
2008-07-10 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-44 |