講演抄録/キーワード |
講演名 |
2018-11-21 13:30
交互学習と多層化によるニューラルネットワークビームフォーマの音声歪み低減の検討 ○江口航平・水町光徳(九工大) EA2018-64 EMM2018-64 |
抄録 |
(和) |
ニューラルネットワークビームフォーマは,目的方向と非目的方向の同時制御が可能であるため,線形演算による遅延和ビームフォーマと比較して雑音抑圧性能が高い.一般に,非線形活性化関数を用いるニューラルネットワークビームフォーマは,出力信号に非線形歪みが生じる.著者らは,この非線形歪みを低減するために,従来の指向特性に基づくコスト関数に加えて,新たにスペクトル歪みに基づくコスト関数を導入し,それらを交互に用いてネットワークの学習を行うビームフォーマを提案した.交互学習ビームフォーマは, 信号対雑音比とスペクトル歪みの両評価尺度において,従来のニューラルネットワークビームフォーマに対する優位性は小さかった。本稿では,交互学習ビームフォーマのネットワーク層数を3層から4層,5層へと変化させた場合,またネットワークの学習方法を変更した場合の性能について検討した。その結果, 信号対雑音比とスペクトル歪みの両評価尺度において,ネットワーク層数は5層が最も望ましいことがわかった。また,学習方法に関しては,コスト関数を用いる順序と学習回数の関係について更なる検討が必要であることがわかった. |
(英) |
A neural network-based beamformer can simultaneously optimize its beam-pattern at the desired and undesired directions so that it enables noise reduction more efficiently compared with a conventional delay-and-sum beamformer with the linear signal processing. In general, the neural network-based beamformer causes the annoying non-linear distortion on the output signal due to the non-linear activation functions. The authors previously proposed a distortion-less neural network-based beamformer with the dual cost functions based on the directivity and spectral distortion. The beamformer was alternatively trained with either the directivity-based or spectral distortion-based cost functions. The proposed beamformer was slightly superior to the conventional non-linear beamformer in the viewpoints of the signal-to-noise ration and spectral distortion. In this paper, the number of the network layers is increased from three to four and five, and the training scheme is reconsidered in training the neural network. It is found that the neural network-based beamformer with five layers achieves the highest performance. Concerning the training scheme, it is necessary to carefully investigate the relationship between the training order with the dual cost functions and the number of iteration. |
キーワード |
(和) |
交互学習 / ビームフォーマ / ニューラルネットワーク / 非線形歪み / / / / |
(英) |
Alternative training / Beamformer / Neural network / Non-linear distortion / / / / |
文献情報 |
信学技報, vol. 118, no. 312, EA2018-64, pp. 7-12, 2018年11月. |
資料番号 |
EA2018-64 |
発行日 |
2018-11-14 (EA, EMM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-64 EMM2018-64 |
研究会情報 |
研究会 |
EA ASJ-H EMM IPSJ-MUS |
開催期間 |
2018-11-21 - 2018-11-22 |
開催地(和) |
ホテルこうしゅうえん(輪島市) |
開催地(英) |
Hotel Koshuen |
テーマ(和) |
<ビギナーズセッション>応用/電気音響,聴覚,音楽情報科学,コンテンツ処理,電子透かし,一般 |
テーマ(英) |
[Beginners Session] Engineering/Electro Acoustics, Psychological and Physiological Acoustics, Music and Computer, Content Processing, Digital Watermarking, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
EA |
会議コード |
2018-11-EA-H-EMM-MUS |
本文の言語 |
日本語 |
タイトル(和) |
交互学習と多層化によるニューラルネットワークビームフォーマの音声歪み低減の検討 |
サブタイトル(和) |
|
タイトル(英) |
Improvement of speech distortion caused by multi-layered neural network-based beamformer with alternative training |
サブタイトル(英) |
|
キーワード(1)(和/英) |
交互学習 / Alternative training |
キーワード(2)(和/英) |
ビームフォーマ / Beamformer |
キーワード(3)(和/英) |
ニューラルネットワーク / Neural network |
キーワード(4)(和/英) |
非線形歪み / Non-linear distortion |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
江口 航平 / Kouhei Eguchi / エグチ コウヘイ |
第1著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: KIT) |
第2著者 氏名(和/英/ヨミ) |
水町 光徳 / Mitsunori Mizumachi / ミズマチ ミツノリ |
第2著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: KIT) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-11-21 13:30:00 |
発表時間 |
150分 |
申込先研究会 |
EA |
資料番号 |
EA2018-64, EMM2018-64 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.312(EA), no.313(EMM) |
ページ範囲 |
pp.7-12 |
ページ数 |
6 |
発行日 |
2018-11-14 (EA, EMM) |
|