講演抄録/キーワード |
講演名 |
2010-08-09 15:15
空間パワースペクトルの主成分分析に基づく時間断続信号の検出 ○加藤通朗・杉本侑哉・牧野昭二・山田武志・北脇信彦(筑波大) EA2010-47 |
抄録 |
(和) |
会議音声アーカイブを効率良く再生するためには,誰がいつ,どのように発話しているかを事前に検出しておくことが重要である.本稿では,相槌のように,発話の時間長が短く,かつ時間的に断続している信号を,連続発話区間や無発話区間と区別した上で,自動的に検出する手法を提案する.提案手法は,マイクロホンアレーにより収録した会議音声データから空間パワースペクトルの時系列を求め,これを主成分分析する.そして,方向毎に求めた主成分スコアに基づいて複数の話者・音源が発する時間断続信号を検出する.インタビュアーが1名,参加者が2名といった,同時発話にスパース性を仮定できる少人数の会議を想定し,提案手法の有効性を検証した.その結果,上位数個の主成分スコアから連続発話,相槌,無発話を検出できる示唆を得た. |
(英) |
It is important for efficiently reviewing meeting speech archives to preliminarily and automatically detect "when, how and who talked". In this paper, we propose a method for automatically detecting a shortand scattered signal such as agreements by using only acoustical
information. The proposed method has two steps: 1) extract a spatial power spectrum frame-by-frame from the meeting speech archive recorded by a microphone array, and 2) detect the target signal by using an outlier detection algorithm based on principal component analysis. To evaluate the effectiveness of the proposed method, we conducted an experiment using the meeting speech archive recorded in a real
room. The experimental results imply that we can detect a long utterance, a short utterance, no utterance from only a few principal components. |
キーワード |
(和) |
会議音声 / ディジタルアーカイブ / 空間パワースペクトル / 主成分分析 / 外れ値検出 / / / |
(英) |
Meeting Recording / Digital Archiving / Spatial Power Spectrum / Principal Component Analysis / Outlier Detection / / / |
文献情報 |
信学技報, vol. 110, no. 171, EA2010-47, pp. 25-30, 2010年8月. |
資料番号 |
EA2010-47 |
発行日 |
2010-08-02 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2010-47 |