講演抄録/キーワード |
講演名 |
2023-03-01 11:00
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査 ○藤村拓弥・戸田智基(名大) EA2022-112 SIP2022-156 SP2022-76 |
抄録 |
(和) |
Deep neural network (DNN)音声強調では,一般的にクリーン音声を学習のターゲットとして用いる.しかしながら,クリーン音声の収録には多大な労力を要すため,大量の学習データの入手は困難な状況にある.これに対して,収録が容易な雑音混入音声をターゲットとして活用するNoisy-target Training (NyTT) を提案し,NyTTがクリーン音声を用いずに音声強調を学習可能であることを実験的に示した.しかしながら,NyTTの動作理由や詳細な特性,大量の雑音混入音声の活用の有効性についての十分な調査は実施されていない.そこで本稿では,NyTTに関する挙動分析を実施することで,その特性に対する理解を深める.さらに,NyTTの特性に基づき,より高品質な音声強調を実現する学習法を提案し,その有効性を示す.また,大量の雑音混入音声の学習への活用が,実際に音声強調性能の向上に有効であるかを調査する. |
(英) |
Deep neural network (DNN)-based speech enhancement usually uses a clean speech as a training target. However, it is hard to collect large amounts of clean speech because its recording is very costly. To relax this limitation, we proposed Noisy-target Training (NyTT) that utilizes noisy speech as a training target. It has been experimentally shown that NyTT can train a DNN without clean speech. However, sufficient investigations have not been conducted to clarify the reason why NyTT works, its detailed property, and the effectiveness of utilizing large amounts of noisy speech. In this paper, we conduct various analyses to deepen our understanding of NyTT. Based on the property of NyTT, we also propose a refined method that performs higher-quality speech enhancement. Furthermore, we investigate whether using a huge amount of noisy speech is effective for improving speech enhancement performance. |
キーワード |
(和) |
単一チャネル音声強調 / Deep Neural Network / 教師なし学習 / 挙動分析 / / / / |
(英) |
Single channel speech enhancement / Deep Neural Network / Unsupervised learning / Behavior analysis / / / / |
文献情報 |
信学技報, vol. 122, no. 387, EA2022-112, pp. 221-226, 2023年2月. |
資料番号 |
EA2022-112 |
発行日 |
2023-02-21 (EA, SIP, SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2022-112 SIP2022-156 SP2022-76 |
研究会情報 |
研究会 |
SP IPSJ-SLP EA SIP |
開催期間 |
2023-02-28 - 2023-03-01 |
開催地(和) |
沖縄県立博物館・美術館 |
開催地(英) |
|
テーマ(和) |
音声,応用/電気音響, 信号処理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
EA |
会議コード |
2023-02-SP-SLP-EA-SIP |
本文の言語 |
日本語 |
タイトル(和) |
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査 |
サブタイトル(和) |
|
タイトル(英) |
Analysis of Noisy-target Training for DNN-based speech enhancement and investigation towards its practical use |
サブタイトル(英) |
|
キーワード(1)(和/英) |
単一チャネル音声強調 / Single channel speech enhancement |
キーワード(2)(和/英) |
Deep Neural Network / Deep Neural Network |
キーワード(3)(和/英) |
教師なし学習 / Unsupervised learning |
キーワード(4)(和/英) |
挙動分析 / Behavior analysis |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
藤村 拓弥 / Takuya Fujimura / フジムラ タクヤ |
第1著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第2著者 氏名(和/英/ヨミ) |
戸田 智基 / Tomoki Toda / トダ トモキ |
第2著者 所属(和/英) |
名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-03-01 11:00:00 |
発表時間 |
20分 |
申込先研究会 |
EA |
資料番号 |
EA2022-112, SIP2022-156, SP2022-76 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.387(EA), no.388(SIP), no.389(SP) |
ページ範囲 |
pp.221-226 |
ページ数 |
6 |
発行日 |
2023-02-21 (EA, SIP, SP) |
|