講演抄録/キーワード |
講演名 |
2009-06-25 10:00
ヒトの聴覚情報処理過程を考慮した音声認識モデル ○羽二生 篤・鵜木祐史・赤木正人(北陸先端大) SP2009-33 |
抄録 |
(和) |
本稿では,「聞き耳」の情報処理過程のモデルを提案し,さらにそのモデルを音声認識へと適用する.人間は複数の音源が存在し,音響的に劣悪な環境においても注意を向けた目的音を聴き取ることができる.目的音に対して注意を向け,トップダウン的に目的音に関する事前情報を積極的に利用して目的音を聞き分ける行為は「聞き耳」として知られるている.本研究では,ヒトの聴覚情報処理過程に対する実験心理学の知見を取り入れた「聞き耳」の機能モデルを提案する.ヒトの聴覚情報処理過程をモデル化しさらに,音声認識へと適応する研究は長年行われてきたが,いずれも既存の認識器の前処理として用いる手法であった.提案する「聞き耳」のモデルは,既存の音声認識器の前処理ではなく,提案モデルそのものが認識器となるようなモデルである.提案モデルに基づく実装システムを構築し,雑音環境下での日本語単数字認識実験を行うことによりシステムの評価を行った.その結果,SNR = 0 dB の環境においてもより頑健に認識が行えることが確認できた.「聞き耳」のモデルを音声認識に適応することの有用性と提案モデルに基づくシステムの雑音環境での頑健性が明らかとなった. |
(英) |
This paper describes a conceptual model of human auditory perception mechanisms for automatic speech recognition (ASR) system. Even in complex noisy environments, humans can perceptually segregate target sound that they applied attention to from an acoustic mixture. The primary advantage of this human ability is known as `attentive ears.' We propose an auditory conceptual-model based on human auditory perceptual ability, `attentive ears,' using results of experimental psychology on human auditory perception mechanisms. Although auditory conceptual-models based on human auditory mechanisms for ASR system were proposed in decade, these conceptual-models were used as a pre-processor in ASR system. Our proposed model functions as ASR system, not as a pre-processor for ASR system. To evaluate the ASR system based on our model, Japanese digit recognition experiments in six typical noisy environments were carried out. Results showed that our ASR system is more robust than traditional ones in experimental conditions of SNR = 0 dB. These results suggest that our auditory conceptual-model based on human auditory perceptual ability, 'attentive ears,' is effective for ASR, and robust in adverse noisy environment. |
キーワード |
(和) |
ヒトの聴覚情報処理過程 / 聞き耳 / 聴覚情景解析 / Bregman の発見則 / 音声認識 / / / |
(英) |
Human auditory perception / Attentive ears / Auditory scene analysis / Bregman's regularities / Automatic speech recognition / / / |
文献情報 |
信学技報, vol. 109, no. 99, SP2009-33, pp. 57-62, 2009年6月. |
資料番号 |
SP2009-33 |
発行日 |
2009-06-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2009-33 |
|