講演抄録/キーワード |
講演名 |
2021-06-19 15:00
非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討 ○南木春希・山岡洸瑛・若林佑幸・小野順貴(都立大) SP2021-22 |
抄録 |
(和) |
本研究では,同期していない複数のボイスレコーダーにより録音された会話音声に対する音源分離の検討を行う.非同期録音に対する前処理として,相互相関と最尤推定によるブラインド同期手法を適用する.次に音源分離手法として,独立ベクトル分析,最大チャネルを選択する時間周波数マスキングや,その出力を局所ガウス分布の分散とした音源モデルによる独立ベクトル分析を検討する.主観評価実験を行い,その結果を示す. |
(英) |
In this study, we investigate the source separation for conversational speech recorded by multiple voice recorders that are not synchronized. First, we apply a blind synchronization method based on cross-correlation and maximum likelihood estimation to asynchronous recorded signals. Then, as source separation methods, we investigate independent vector analysis (IVA), a time-frequency (TF) masking-based method to pass only the largest channel, and IVA with a source model in which the variance of the local Gaussian is replaced with a TF masking output mentioned above. An experiment on subjective evaluation is conducted, and the results are shown below. |
キーワード |
(和) |
時間周波数マスキング / 独立ベクトル分析 / ブラインド音源分離 / 非同期 / / / / |
(英) |
Time-frequency masking / Independent vector analysis / Blind source separation / Asynchronous / / / / |
文献情報 |
信学技報, vol. 121, no. 66, SP2021-22, pp. 101-106, 2021年6月. |
資料番号 |
SP2021-22 |
発行日 |
2021-06-11 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2021-22 |