講演抄録/キーワード |
講演名 |
2009-12-17 16:00
[フェロー記念講演]音声信号処理システムの高速・低消費電力化について ○宮永喜一(北大) SIS2009-42 |
抄録 |
(和) |
本報告では,雑音にロバストな音声認識システムについて,その概要を紹介する。狭義の音声認識とは,観測された音声波形がどのような言葉であるかを認識し,その結果を出力することである。この意味での音声認識が広く一般的に使われているが,本来,ユーザが期待している音声認識システムとは,どのような音が入力されても問題なく,その中から,認識対象となる音声を検出し,その検出音声に対して認識処理をして,最終出力を行うものであり,その認識性能が,様々な雑音環境であっても,高い認識率を有するものでなくてはならない。本報告で紹介するシステムは,ターゲットとする音声フレーズを,自動で検出し,弱エコー環境(300msecまでのエコー)で,75dBまでの騒音環境下でも,常に90%以上の認識率を実現できる方式を実装している。また,それらのシステムが,専用のハードウエア化により,実時間で動作しながら,同時に低諸費電力化を実現しており,実環境において有効に活用できる音声認識システムであることを述べる。 |
(英) |
In this report, a new noise robust speech recognition system is introduced. As a narrow sense of speech recognition, a system can recognize an observed waveform and then represents its result as an output. Such speech recognition systems are widely developed and presented. However, many users expect that a desired speech recognition system can observe any sound including speech, automatically extract a speech sound which should be recognized and then correctly recognize its speech waveform. It must show high recognition rate even under noisy circumstances. In this report, the system can automatically search a target speech sound among any observed data and recognize it with over 90\% correctness under the conditions of 75dB sound-level circumstances and 300msec echo. This system is also designed as LSI hardware. It is shown that the designed system can execute on real-time and with low power consumption. |
キーワード |
(和) |
音声認識 / 音声特徴抽出 / 音声区間検出 / 音声棄却 / 雑音ロバスト音声処理 / / / |
(英) |
Speech Recognition / Speech Feature Extraction / Speech Detection / Speech Rejection / Noise Robust Speech Processing / / / |
文献情報 |
信学技報, vol. 109, no. 338, SIS2009-42, pp. 67-72, 2009年12月. |
資料番号 |
SIS2009-42 |
発行日 |
2009-12-10 (SIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SIS2009-42 |