講演抄録/キーワード |
講演名 |
2019-03-14 13:30
[ポスター講演]MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調 ○山岡洸瑛(筑波大)・小野順貴(首都大東京)・牧野昭二・山田武志(筑波大) EA2018-124 SIP2018-130 SP2018-86 |
抄録 |
(和) |
本稿では,ステレオマイクロフォンから利用可能な新たな劣決定音声強調手法を提案する.我々は以前,時間周波数点毎に事前構成した複数のビームフォーマを切り替えて音声強調を行う時間周波数スイッチング (time-frequency-bin-wise switching; TFS) ビームフォーマを提案した.しかし,TFS ビームフォーマは劣決定系において高い音声強調性能を示す一方で,目的音源および存在するそれぞれの干渉音源の事前情報を用いて複数のビームフォーマのフィルタ係数を事前に推定する必要があり,実環境における使用に制限があった.本稿では,この問題を解決するため,ビームフォーマの構成と切り替えを同時最適化問題として再定式化し,それを解く新たなアルゴリズムを提案する.提案するアルゴリズムは,時間周波数点毎に最も支配的な音源のクラスタリングとその点を用いた最小分散無歪応答(minimum variance distortionless response; MVDR) ビームフォーマの構成という2つのステップにより音声強調を行っていると解釈することができる.実験では,干渉音の方向によらず,従来の時間周波数マスキングやMVDR ビームフォーマを上回る音声強調性能を達成することを確認した. |
(英) |
In this paper, we present an underdetermined speech enhancement method called the time-frequency-bin-wise switching beamformer. In this method, we switch multiple preconstructed beamformers in each time-frequency (TF) bin, each of which suppresses a particular interferer. However, this method requires the target-active period and interferer-wise-active periods as the prior information. In this paper, to overcome this limitation, we formulate the switching and construction of beamformers as a joint optimization problem, which can be understood from two viewpoints: the clustering of the most dominant interferer signal in each TF bin and the construction of MVDR beamformers using such bins. |
キーワード |
(和) |
ビームフォーミング / 時間周波数点マスキング / 劣決定問題 / 音声強調 / 非線形信号処理 / / / |
(英) |
beamforming / time-frequency masking / underdetermined situation / speech enhancement / nonlinear signal processing / / / |
文献情報 |
信学技報, vol. 118, no. 497, SP2018-86, pp. 149-154, 2019年3月. |
資料番号 |
SP2018-86 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-124 SIP2018-130 SP2018-86 |
|