講演抄録/キーワード |
講演名 |
2019-12-13 13:25
ブラインド音声抽出のための多変量複素一般化Gauss分布に基づくランク制約付き空間共分散行列推定法及びその高速化 ○久保優騎・高宗典玄(東大)・北村大地(香川高専)・猿渡 洋(東大) EA2019-78 |
抄録 |
(和) |
本稿では,拡散性音源中に存在する方向性の目的音声を分離・抽出する手法であるランク制約付き空間共分散行列推定法における生成モデルを一般化する.従来のランク制約付き空間共分散行列推定法は ILRMA によるパラメタ推定の後に, ILRMA で推定されたパラメタを用いて観測信号を多変量複素 Gauss 分布によりモデル化することで,効率的かつ高速に目的音声を分離する.本稿では多変量複素一般化 Gauss 分布により観測信号をモデル化し,パラメタを最尤推定する手法を提案する.従来のモデルに用いられるパラメタ推定の高速化手法を提案モデルにも適用する.評価実験ではシミュレーションにより得られた拡散性の人混み雑音,駅雑音,及び交通雑音中の音声信号を分離する実験及び実環境下で録音したデータを用いた分離実験により,提案法の従来法に対する優位性を示す. |
(英) |
In this paper, we generalize a generative model in rank-constrained spatial covariance matrix estimation that separates and extracts directional target speech from diffuse background sources. Conventional method models an observed signal with the multivariate complex Gaussian distribution using parameters estimated by ILRMA in advance and efficiently separates the target speech. This paper models an observed signal with the multivariate complex generalized Gaussian distribution and proposes its optimization algorithm. Also, the acceleration method for conventional method can be applied to the proposed model. In the experiments, we separate simulated speech signal under diffuse babble, station, and traffic noise and real-recorded speech signal under diffuse noise to show superiority of the proposed method. |
キーワード |
(和) |
ブラインド音源分離 / 空間共分散モデル / 多変量複素一般化Gauss分布 / 補助関数法 / 乗算型更新則 / / / |
(英) |
blind source separation / spatial covariance matrix / multivariate complex generalized Gaussian distribution / auxiliary function method / multiplicative update rule / / / |
文献情報 |
信学技報, vol. 119, no. 334, EA2019-78, pp. 85-92, 2019年12月. |
資料番号 |
EA2019-78 |
発行日 |
2019-12-05 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-78 |
|