講演抄録/キーワード |
講演名 |
2012-01-26 13:00
ポスタ会議発表音声アーカイブ構築を目的としたブラインド音声抽出の評価 ○岡本広大・宮崎亮一・猿渡 洋・鹿野清宏(奈良先端大) EA2011-107 |
抄録 |
(和) |
本稿ではポスタ会議発表の音声アーカイブ構築のため,目的話者の音声のみを高品質に抽出する事を目的とした19チャネルマイクロホンアレーを用いた収録システムと,画像情報を用いた目的音抽出によるダイアライゼーションを提案する.
音源分離実験では,発表者抽出の場合は4.9 dBから6.6 dB程度の音声歪みで,8.9 dBから34.0 dB程度の雑音抑圧量を,質問者抽出の場合は6.0 dBから8.1 dB程度の音声歪みで,4.6 dBから10.1 dB程度の雑音抑圧量を実現した.
また,ダイアライゼーション実験では,発表者の場合は.0.99の{\itshape F}値,質問者の場合は0.88の{\itshape F}値に相当する推定精度を実現した. |
(英) |
In this report, we propose a 19-channel microphone array recording system used for blind speech extraction and diarization with image information to make speech archives of poster session.
This system realizes noise reduction of 8.9 dB to 34.0 dB under the conditions of cepstral distortion of 4.9 dB to 6.6 dB when a presenter is extracted, and noise reduction of 4.6 dB to 10.1 dB under the conditions of cepstral distortion of 6.0 dB to 8.1 dB when a questioner is extracted.
Also, it is revealed that the system's diarization accuracy corresponds to {\itshape F-measure} of 0.99 when a presenter is extracted and {\itshape F-measure} of 0.88 when a questioner is extracted. |
キーワード |
(和) |
マイクロホンアレー信号処理 / ブラインド音源分離 / 独立成分分析 / ブラインド空間的サブトラクションアレー / ダイアライゼーション / / / |
(英) |
Microphone Array Signal Processing / Blind Source Separation / Independent Component Analysis / Blind Spatial Subtraction Array / Diarization / / / |
文献情報 |
信学技報, vol. 111, no. 402, EA2011-107, pp. 19-24, 2012年1月. |
資料番号 |
EA2011-107 |
発行日 |
2012-01-19 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2011-107 |