お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-07-20 13:00
ニューラルソフトマスクを用いた所望方向の音声抽出のための適応ビームフォーマ
中込 優早大/LINE)・戸上真人LINE)・小林哲則早大SP2019-8
抄録 (和) 教師あり学習による音源到来方向 (DOA)推定に基づくマルチチャネル音声抽出法を提案する.
目的方向から到来する音声のみを通過させる時間周波数マスクから推定される共分散行列によってマルチチャネルビームフォーマが構成される.
提案する時間周波数マスクは時間周波数ごとのDOA推定結果から構成されるが,時間周波数ごとのDOA推定結果はマイク配置のズレや初期反射音の影響に敏感に影響を受けることが知られている.
提案法では広帯域の推定結果を用いて誤ったDOA推定結果の補正を教師あり学習する.
また,共分散行列の推定に適さない時間周波数ビンを小さな重みにするといった,時間周波数ビンの信頼度を推定する.
提案法では,ニューラルネットワークのパラメータは与える目的方向に依存していないため,目的方向を自由に操作できる.
実験の結果,提案法では,目的方向や音源の性別,マイク配置に関わらず目的音を抽出でき,また時間周波数ビンの信頼度の推定を行った方が,信頼度の推定を行わなかったものより高い音声抽出性能を示すことを確認した. 
(英) A multi-channel speech extraction guided by direction-of-arrival (DOA) estimation is addressed in this paper. A multi-channel beamformer is constructed by multi-channel covariance matrices estimated via a time-frequency mask (TFM) which passes a speech source coming from the target direction. The TFM in the proposed method is constructed via the DOA estimate. Since the DOA estimate is sensitive to microphone-arrangement error or early reverberation effect, the proposed method restores the DOA estimate in a supervised way with a neural network. Additionally, reliability of each time-frequency bin is also estimated so as to lower weight for a time-frequency bin which is not adequate for estimation of the multi-channel covariance matrices. In the proposed method, the network parameters are free from the target direction setting and the target direction is controllable. Experimental results indicate that the proposed method can extract the target speech regardless of target direction, gender, and microphone arrangement and that TFM w/ reliability estimation can extract the target speech more accurately than the TFM w/o reliability estimation.
キーワード (和) 空間ビームフォーマ / 時間周波数マスク / 到来音源方向推定 / ニューラルネットワーク / 音声抽出 / / /  
(英) spatial beamforming / time-frequency mask / DOA estimation / neural networks / speech extraction / / /  
文献情報 信学技報, vol. 119, no. 138, SP2019-8, pp. 9-14, 2019年7月.
資料番号 SP2019-8 
発行日 2019-07-13 (SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2019-8

研究会情報
研究会 SP IPSJ-SLP  
開催期間 2019-07-20 - 2019-07-20 
開催地(和) 風鈴屋(新潟県月岡温泉) 
開催地(英) FURINYA(Tsukioka-Onsen, Niigata) 
テーマ(和) 認識,理解,対話,一般 
テーマ(英) Speech recognition and understanding, dialog system, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2019-07-SP-SLP 
本文の言語 日本語 
タイトル(和) ニューラルソフトマスクを用いた所望方向の音声抽出のための適応ビームフォーマ 
サブタイトル(和)  
タイトル(英) Adaptive Beamformer for Extracting Speech in Desired Direction Using Neural Soft-Mask 
サブタイトル(英)  
キーワード(1)(和/英) 空間ビームフォーマ / spatial beamforming  
キーワード(2)(和/英) 時間周波数マスク / time-frequency mask  
キーワード(3)(和/英) 到来音源方向推定 / DOA estimation  
キーワード(4)(和/英) ニューラルネットワーク / neural networks  
キーワード(5)(和/英) 音声抽出 / speech extraction  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 中込 優 / Yu Nakagome / ナカゴメ ユウ
第1著者 所属(和/英) 早稲田大学/LINE株式会社 (略称: 早大/LINE)
Waseda University/LINE Corporation (略称: Waseda Univ./LINE)
第2著者 氏名(和/英/ヨミ) 戸上 真人 / Masahito Togami / トガミ マサヒト
第2著者 所属(和/英) LINE株式会社 (略称: LINE)
LINE Corporation (略称: LINE)
第3著者 氏名(和/英/ヨミ) 小林 哲則 / Tetsunori Kobayashi / コバヤシ テツノリ
第3著者 所属(和/英) 早稲田大学 (略称: 早大)
Waseda University (略称: Waseda Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2019-07-20 13:00:00 
発表時間 30分 
申込先研究会 SP 
資料番号 SP2019-8 
巻番号(vol) vol.119 
号番号(no) no.138 
ページ範囲 pp.9-14 
ページ数
発行日 2019-07-13 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会