講演抄録/キーワード |
講演名 |
2017-03-01 12:40
[ポスター講演]調波構造に基づくDeep Auto Encoderを用いた残響下音声強調 ○太田陸斗・若林佑幸・福森隆寛・中山雅人・西浦敬信(立命館大) EA2016-107 SIP2016-162 SP2016-102 |
抄録 |
(和) |
本稿では,調波構造に基づくDeep Auto Encoder(DAE)を用いた残響下音声強調手法について述べる.DAE とは回帰タスクのためのDeep Neural Network(DNN)のことである.最近,対数パワースペクトルを特徴量とし,残響が重畳された音声からクリーン音声を復元するDAE が検討されている.しかしながら,残響構造の複雑さゆえにモデルの最適化が困難となり,強調音声のスペクトル(特に調波構造)が十分に復元されない問題がある.そこで本稿では,残響音声から抽出した調波構造によりDAE の入力特徴量を拡張することで残響下音声強調の性能向上を目指す.また,調波構造を正確に抽出するため,連続スペクトル減算により残響に頑健なF0 推定を検討する.最後に,提案手法の有効性を確認するため客観評価実験を実施した.客観評価実験では,調波構造の抽出精度を評価した後,強調音声の音声品質をPESQ によって評価した.実験の結果より,入力特徴量に調波構造を追加することでPESQ スコアが改善し,高い音声品質を保持できることを確認した. |
(英) |
This paper describes reverberant speech enhancement (RSE) with deep auto encoder (DAE) based on harmonic structure. DAEs have been also investigated for RSE based on log power spectra. However, these methods are unable to accurately restore harmonics because it is difficult to optimize the DAE model. Therefore, we proposed an approach to RSE adopting DAE augmented with harmonic structure as input. In addition, we investigate reverberation robust F0 estimation using continuous spectral subtraction in order to accurately extract the harmonic structure. We evaluated the speech quality by PESQ. As a result, we confirmed an effectiveness of the proposed method. |
キーワード |
(和) |
残響下音声強調 / DNN / deep auto encoder / 調波構造 / 連続スペクトル減算 / / / |
(英) |
reverberant speech enhancement / DNN / deep auto encoder / harmonic structure / continuous spectral subtraction / / / |
文献情報 |
信学技報, vol. 116, no. 477, SP2016-102, pp. 141-146, 2017年3月. |
資料番号 |
SP2016-102 |
発行日 |
2017-02-22 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2016-107 SIP2016-162 SP2016-102 |