講演抄録/キーワード |
講演名 |
2018-07-26 16:45
雑音重畳音声と強調音声の併用による単一チャネル雑音下音声認識 ○藤本雅清・河井 恒(NICT) SP2018-19 |
抄録 |
(和) |
多くの場合,単一チャネルによる音声強調を用いると音声歪みの影響により,音声強調を行わない場合に比べて音声認識性能が劣化する傾向にある.この問題に対して,本研究では特徴量レベルで雑音重畳音声と強調音声を結合し,音声認識の入力とすることにより音声認識性能の改善が得られることを示す.また,特徴量レベルでの単純な結合だけでなく,それぞれの音声のDNN(補助ネットワーク)レベルでの結合,ゲート機構によるそれぞれの音声の明示的な取捨選択を導入することにより更なる改善が得られることを示す. |
(英) |
In many cases, single channel speech enhancement seriously deteriorates speech recognition accuracy due to the influence of speech distortion.
In this paper, we propose a method of single channel noise robust speech recognition based on feature-level combination of noisy speech and enhanced speech.
In addition, we also reveal that further improvements are obtained by using DNN-level (sub-network) combination and a gating mechanism which can explicitly select adequate speech signal. |
キーワード |
(和) |
雑音に頑健な音声認識 / 音声強調 / 単一チャネル入力 / 特徴量/補助ネットワーク結合 / ゲート機構 / / / |
(英) |
noise robust speech recognition / speech enhancement / single-channel input / feature / sub-network combination / gating mechanism / / / |
文献情報 |
信学技報, vol. 118, no. 160, SP2018-19, pp. 15-20, 2018年7月. |
資料番号 |
SP2018-19 |
発行日 |
2018-07-19 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2018-19 |