講演抄録/キーワード |
講演名 |
2014-07-26 10:30
複数スマートフォンで収録された多人数会話音声における対話グループ検出と話者決定 ○岩野公司・飯塚瞳子・齋藤かの子・米山修平(東京都市大) SP2014-71 |
抄録 |
(和) |
本稿では,会話や会議の参加者が各自の所有するスマートフォンで音声を収録することで集められた,複数の多人数会話音声の処理について論じる.このようなデータに対して必要となる処理技術として,「対話グループ検出」と「話者決定」が挙げられる.本研究では,この2つの技術について基礎的な手法を提案し,それぞれの性能を検証する.性能評価のため,15件の多人数会話の音声を参加者各自のスマートフォンで収録し,約7時間の音声データベースを構築した. 対話グループ検出については,参加者ごとの音データを,音響特徴量を用いて高次元ベクトルで表現し,それらをクラスタリングする方法を提案する.実験の結果,純度は最大で89.5%となった.話者決定については,参加者各自のスマートフォンで収録した音声から所有者の話者モデルを構築し,全参加者の話者モデルと併用して音声認識と同様の枠組みで最尤となるモデル系列を求め,所有者の発声区間を推定する手法を提案する.実験の結果,最大検出性能はF値で64.4%となった. |
(英) |
This paper describes acoustic information processing techniques for multi-party conversational speech recorded by attendees’ smartphones. “Dialogue group detection” and “speaker diarization” are essential techniques for processing such conversational speech. In this paper, we propose baseline methods for the two techniques and evaluate their performance. In order to build the speech database for the evaluation, 7 hours of speech data are collected from 15 multi-party conversations by using multiple smartphones. Our proposed group detection method converts acoustic data recorded by each attendee’s smartphone into a high-order feature vector, and then employs a cluster analysis for a set of the vectors. Experimental results show that the best purity calculated from the estimated dialogue groups is 89.5%. Our speaker diarization method detects voice segments of each smartphone owner from the speech data recorded by his/her own smartphone. It is based on the same framework as that of speech recognition, and uses speaker models of all attendees. Experimental results show that the best detection rate (F-measure value) is 64.4%. |
キーワード |
(和) |
多人数会話 / 対話グループ検出 / 話者決定 / スマートフォン / / / / |
(英) |
Multi-party conversational speech / Dialogue group detection / Speaker diarization / Smartphone / / / / |
文献情報 |
信学技報, vol. 114, no. 151, SP2014-71, pp. 47-52, 2014年7月. |
資料番号 |
SP2014-71 |
発行日 |
2014-07-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-71 |