講演抄録/キーワード |
講演名 |
2010-12-10 14:50
[招待講演]時間周波数マスクによる実環境でのブラインド音源分離 ○澤田 宏・荒木章子(NTT) EA2010-104 |
抄録 |
(和) |
本稿では,時間周波数マスクによるブラインド音源分離手法を概説し,実環境での音の混合に対する分離性能を高めた方法を説明する.時間周波数マスクによる方法は,マイクロホンの数が音源の数よりも少ない,いわゆる劣決定の場合にも適用できる.分離は周波数領域で行われ,本提案手法は二段階の処理となる.一段階目で,EMアルゴリズムにより,周波数領域の混合サンプルを音源毎にクラスタリングする.二段階目では,周波数毎のクラスタリング結果のパーミュテーションの任意性を揃える.これは,各サンプルが各クラスタにどの程度の確率で属するかという情報を用いて行う.ある程度の残響を持つ環境で,4音源の混合をを3マイクロホンで観測して分離する実験結果により,本手法の優位性を示した. |
(英) |
A blind source separation method for convolutive mixtures is presented. The method is based on time-frequency masks and can be applied even to an underdetermined case where the number of microphones is less than the number of sources. The separation operation is performed in the frequency domain and consists of two stages. In the first stage, frequency-domain mixture samples are clustered into each source by an expectation-maximization (EM) algorithm. In the second stage, the permutation ambiguities of the bin-wise clustered samples are aligned by using the probability on how likely each sample belongs to the assigned class. Experimental results for separating four speech signals with three microphones under reverberant conditions show the superiority of the presented method over existing methods. |
キーワード |
(和) |
ブラインド音源分離 / 畳み込み混合 / 短時間フーリエ変換 / スパース性 / 時間周波数マスク / EMアルゴリズム / パーミュテーション問題 / |
(英) |
Blind source separation / Convolutive mixture / Short-time Fourier transform / Sparseness / Time-frequency mask / EM algorithm / Permutation problem / |
文献情報 |
信学技報, vol. 110, no. 331, EA2010-104, pp. 43-48, 2010年12月. |
資料番号 |
EA2010-104 |
発行日 |
2010-12-03 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2010-104 |