講演抄録/キーワード |
講演名 |
2017-12-21 12:50
[ポスター講演]DNN適応に基づく非可聴つぶやき認識用話者・環境依存音響モデルの構築 ○野田聖太・林 知樹・戸田智基・武田一哉(名大) SP2017-56 |
抄録 |
(和) |
本研究では,サイレント音声インタフェースの実現に向けて,実環境下における非可聴つぶやき(Non-Audible Murmur: NAM)認識の性能改善に取り組む.
深層学習による音響モデルをNAM認識に導入するとともに,話者適応学習によるNAM認識用話者依存音響モデルを構築する.
また,雑音環境下におけるNAM認識性能を改善するために,雑音重畳NAMデータを用いて雑音依存音響モデルを構築する.
構築した音響モデルの有効性を調査するため,静寂環境下ならびに雑音環境下におけるNAM認識実験を行う.
実験結果から,深層学習に基づく話者・環境依存音響モデルの有効性を示すとともに,一部の雑音環境下においては静寂環境下と同等の認識性能が得られることを示す. |
(英) |
In this research, we aim to improve the performance of non-audible murmur (NAM) recognition towards the development of silent speech interfaces.
First, we apply a deep learning technique to the acoustic modeling of NAM and develop speaker-dependent acoustic models using speaker adaptive training for a deep neural network (DNN).
Moreover, to improve the recognition performance under noisy conditions, we also develop the noise-dependent acoustic models using noisy NAM data generated by superimposing noise signals recorded with NAM microphone.
Experimental results show that our developed speaker- and noise-dependent acoustic models are effective for significantly improving NAM recognition performance under both clean and noisy conditions and achieving recognition performance under some noisy conditions comparable to that under the clean condition. |
キーワード |
(和) |
非可聴つぶやき認識 / 音響モデル / 深層学習 / 話者適応 / 環境適応 / / / |
(英) |
Non-Audible Murmur recognition / acoustic model / deep learning / speaker adaptation / noise adaptation / / / |
文献情報 |
信学技報, vol. 117, no. 368, SP2017-56, pp. 7-10, 2017年12月. |
資料番号 |
SP2017-56 |
発行日 |
2017-12-14 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
SP2017-56 |