講演抄録/キーワード |
講演名 |
2019-12-12 14:25
雑音情報を含めたマルチタスク学習による音声強調ネットワークの性能改善 ○田中晴樹(徳山高専)・杉浦陽介・安井希子・島村徹也(埼玉大)・宮崎亮一(徳山高専) EA2019-70 |
抄録 |
(和) |
現在,信号処理分野では音声強調に対する関心が高まっている.近年,深層学習を用いた多くの音声強調手法が提案されており,その中でも波形データを入出力とし,ネットワークにオートエンコーダを用いるSEGANやWave-U-Netが高い性能を発揮している.本論文では,雑音混入音声に含まれる音声と雑音の情報を同時に学習する2つのオートエンコーダを持ち,それらの潜在ベクトルを互いに条件付けるアーキテクチャによる音声強調手法を提案する.我々のネットワークの入力は雑音混入音声を使用し,一方のオートエンコーダがクリーン音声,他方が雑音情報を出力する.客観評価実験では,提案手法がPESQ,CSIG,COVLによる客観評価尺度でSEGANのスコアを超えたことを示した. |
(英) |
In the signal processing field, there is a growing interest in speech enhancement.Recently, a lot of speech enhancement methods using deep learning have been proposed. Mostly, SEGAN and Wave-U-Net, which use waveform data as input/output and automatic encoder for network, have shown high performance. In this paper, we propose a speech enhancement method based on an architecture mutually constraining latent vectors of two autoencoders simultaneously learning speech and noise information contained in noise mixed speech. The input of our network uses noise-contaminated speech, and one auto-encoder outputs clean speech and the other outputs noise information. In the experiment, we show that the proposed method exceeded the score of SEGAN in the objective evaluation scale by PESQ, CSIG, and COVL. |
キーワード |
(和) |
音声強調 / 深層学習 / オートエンコーダ / マルチタスク学習 / 敵対的生成ネットワーク / / / |
(英) |
Speech Enhancement / Deep Learning / Autoencoder / Malti-task Learning / Generative Adversarial Nets / / / |
文献情報 |
信学技報, vol. 119, no. 334, EA2019-70, pp. 31-36, 2019年12月. |
資料番号 |
EA2019-70 |
発行日 |
2019-12-05 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-70 |