講演抄録/キーワード |
講演名 |
2018-03-20 14:20
音声強調のための深層ニューラルネットワーク構造の検討 ○杉浦陽介・島村徹也(埼玉大) EA2017-171 SIP2017-180 SP2017-154 |
抄録 |
(和) |
本稿では,音声強調に向けた深層ニューラルネットワークの構造を検討する.音声強調においては,無音区間での雑音の抑制,有音区間におけるスペクトル包絡の保持が大きな課題となる.しかし特徴量である振幅スペクトルのもつ大きなばらつきと,また回帰問題の複雑性からネットワークがアンダーフィッティングして音質が劣化していた.そこで本稿では,音声強調におけるスペクトルゲイン関数を最適化する変数として扱うことで解空間を制約し問題の複雑性を緩和する.加えて,音声スペクトルの分布に基づき損失関数を適切に設計することで,音声強調性能の向上を試みる. |
(英) |
In this paper, we study a structure of a deep neural network for speech enhancement.In speech enhancement, it is a big issue to suppress the noise in the silent interval and maintain a spectral envelope in the voiced interval, simultaneously. Because of a large variability of the amplitude spectrum, which is one of the features, and the complexity of the regression problems, the network has an under-fitting and then the speech quality is degraded. This paper, thus, relaxes the complexity of the problem by constraining a solution space to optimize an spectral gain of speech enhancement. Additionally, this paper tries to improve the speech enhancement performance by designing a loss function appropriately according to the distribution of the speech spectrum. |
キーワード |
(和) |
音声強調 / 深層学習 / / / / / / |
(英) |
Speech Enhancement / Deep Neural Network / / / / / / |
文献情報 |
信学技報, vol. 117, no. 517, SP2017-154, pp. 379-384, 2018年3月. |
資料番号 |
SP2017-154 |
発行日 |
2018-03-12 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2017-171 SIP2017-180 SP2017-154 |
研究会情報 |
研究会 |
SIP EA SP MI |
開催期間 |
2018-03-19 - 2018-03-20 |
開催地(和) |
石垣島 ホテルミヤヒラ |
開催地(英) |
|
テーマ(和) |
音声,応用/電気音響,信号処理,一般 [SIP,EA,SP]/ 医用画像工学一般 [MI] |
テーマ(英) |
Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics [SIP, EA, SP]/ Medical Image Engineering, Analysis, Recognition, etc. [MI] |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2018-03-SIP-EA-SP-MI |
本文の言語 |
日本語 |
タイトル(和) |
音声強調のための深層ニューラルネットワーク構造の検討 |
サブタイトル(和) |
|
タイトル(英) |
A Study on Structure of Deep Neural Network for Speech Enhancement |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声強調 / Speech Enhancement |
キーワード(2)(和/英) |
深層学習 / Deep Neural Network |
キーワード(3)(和/英) |
/ |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
杉浦 陽介 / Yosuke Sugiura / スギウラ ヨウスケ |
第1著者 所属(和/英) |
埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.) |
第2著者 氏名(和/英/ヨミ) |
島村 徹也 / Tetsuya Shimamura / シマムラ テツヤ |
第2著者 所属(和/英) |
埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-03-20 14:20:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
EA2017-171, SIP2017-180, SP2017-154 |
巻番号(vol) |
vol.117 |
号番号(no) |
no.515(EA), no.516(SIP), no.517(SP) |
ページ範囲 |
pp.379-384 |
ページ数 |
6 |
発行日 |
2018-03-12 (EA, SIP, SP) |
|