講演抄録/キーワード |
講演名 |
2011-03-10 11:10
HMMを用いたオフライン手書き単語認識における環境クラスタリングとGMMの同時最適化 ○浜村倫行(東芝/東大)・入江文平(東芝)・西本卓也・小野順貴・嵯峨山茂樹(東大) PRMU2010-244 |
抄録 |
(和) |
音声認識で広く使われている環境依存HMM には、環境クラスタリングとtied-mixture の二つのアプローチがあり、環境クラスタリングの方が認識精度が高いことが報告されている。しかし、手書き単語認識の場合、筆記体とブロック体など全く異なる字体が一つの文字カテゴリに混在するため、環境クラスタリングが困難となる。そこで、これを解決する方法として、環境クラスタリングと混合ガウス分布(GMM) の同時最適化法を提案する。まず環境クラスタリングをEM アルゴリズムで最適化する方法を述べ、更にそれを拡張しGMM の同時最適化を導く。CEDARデータベースを用いた実験によりtied-mixture による従来法と比べ最大24.2%のエラー削減率を確認した。また計算効率同等の条件でも提案法の認識精度が高いことを確認した。 |
(英) |
Context-dependent HMM is commonly used in speech recognition. The model can be realized by two ways: context clustering or tied-mixuture. In speech recognition, the former is reported to be more efficient. However, there is some difficulty in applying context clustering to handwritten word recognition, since the distribution of each character is typically a mixture of some different distributions, such as block-printed, cursive, etc. To deal with this problem, a method for concurrent optimization of context clustering and Gaussian Mixture Model (GMM) is proposed in this paper. Optimization of context clustering by EM algorithm is described first, followed by its expansion to concurrent optimization of context clustering and GMM. The recognition rate of the proposed method is higher than the conventional one which exploits tied-mixture with equivalent computational cost. Experimental results showed 24.2% error reduction on CEDAR database, compared with the conventional tied-mixture based method. |
キーワード |
(和) |
手書き単語認識 / 環境依存HMM / 環境クラスタリング / GMM / EMアルゴリズム / / / |
(英) |
Handwritten word recognition / Context-dependent HMM / Context clustering / GMM / EM algorithm / / / |
文献情報 |
信学技報, vol. 110, no. 467, PRMU2010-244, pp. 43-48, 2011年3月. |
資料番号 |
PRMU2010-244 |
発行日 |
2011-03-03 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-244 |