講演抄録/キーワード |
講演名 |
2012-01-25 10:50
子音・母音認識システムにおける音声前処理回路 ○岡本佳太・田向 権・関根優年(東京農工大) VLD2011-93 CPSY2011-56 RECONF2011-52 |
抄録 |
(和) |
人間の聴覚は雑音環境下であっても音声認識や音源の方向推定を即座に行うことができる.これを可能としているのは聴覚前処理部である蝸牛と呼ばれる器官の働きが大きいと考えられている.そこで本研究では蝸牛内のリンパ液による音波の減衰を離散Wavelet変換による多重解像度解析により模擬する.先行研究において,母音認識と子音認識が行われており,これらは,FPGAを用いた回路化で実現し,蝸牛内での複雑な処理の模擬を行っている.今回は子音,母音認識システムを統合した音素認識システムの構築を行い,その回路規模がどの程度のものになるかの検証をするとともに,システム全体の認識における有用性の評価も行った. |
(英) |
The human audition can quickly estimate direction of sound and realize speech recognition under the noisy environment. It is thought that an auditory preprocessing organ called cochlea has the function. Therefore, this study mimics an attenuation of sound by lymph fluid in the cochlea using a multiresolution by discrete wavelet transform. In our previous study, a vowel and consonant recognition system and these FPGA implementation have been independently created to mimic the complex processing of the cochlea. In this study, we construct a speech recognition system integrated with the vowel and consonant recognition system. In order to show its effectiveness, we verify the circuit size and recognition rate of the proposed system. |
キーワード |
(和) |
母音認識 / 子音認識 / 音声認識 / FPGA / 多重解像度解析 / テンプレートマッチング / / |
(英) |
Vowel Recognition / Consonant Recognition / Speech Recognition / FPGA / Multiresolution / Template Matching / / |
文献情報 |
信学技報, vol. 111, no. 397, VLD2011-93, pp. 13-18, 2012年1月. |
資料番号 |
VLD2011-93 |
発行日 |
2012-01-18 (VLD, CPSY, RECONF) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
VLD2011-93 CPSY2011-56 RECONF2011-52 |
|