講演抄録/キーワード |
講演名 |
2010-05-26 13:25
会議音声認識のためのスペクトル減算に基づくオンライン音源分離 ○那須 悠・篠田浩一・古井貞熙(東工大) EA2010-2 SIP2010-2 SP2010-2 |
抄録 |
(和) |
会議音声の認識を目的とした実時間処理が可能な音源分離手法を提案する.提案法では,スペクトル減算法に基づき,各話者が装着するピンマイクによる観測信号から目的話者の音声以外の信号成分を減算することにより音声の分離を行う.従来手法と比較して必要な演算量が小さく,また分離信号の歪みが小さく音声認識に適する.計算機シミュレーションによる音声認識実験では,同時発話を含む音声の単語正解精度が 66.5 % であったものが,提案法の適用により 77.7 % に改善された.実環境で収録した会議音声に対しても音声区間検出と音声認識の評価を行い,精度の向上を確認した. |
(英) |
This paper proposes a speech separation method for meeting speech recognition, which operates in real time. The proposed method suppresses interfering components in speech signals using spectral subtraction, where the signals are recorded with tie-clip microphones attached to the lapels of the speakers. Compared with the other conventional methods, it requires less computational costs and the separated speech signals have less distortion. In a recognition task of simulated partly-overlapped speech, the proposed method improved the word accuracy from 66.5 % to 77.7 %. We also evaluated the method on speech data recorded in real meeting, and confirmed the improvement in accuracies of voice activity detection and speech recognition. |
キーワード |
(和) |
音源分離 / スペクトル減算 / 音声区間検出 / 会議音声認識 / / / / |
(英) |
Sound source separation / Spectral subtraction / Voice activity detection / Meeting speech recognition / / / / |
文献情報 |
信学技報, vol. 110, no. 56, SP2010-2, pp. 7-12, 2010年5月. |
資料番号 |
SP2010-2 |
発行日 |
2010-05-19 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2010-2 SIP2010-2 SP2010-2 |
|