講演抄録/キーワード |
講演名 |
2008-02-22 09:00
文字構造の文法記述に基づくオンライン手書き漢字列認識 ○大田郁実・山本 遼・西本卓也・嵯峨山茂樹(東大) PRMU2007-227 |
抄録 |
(和) |
本論文では、漢字の構造を文脈自由文法に基づいて記述し、オンライン孤立漢字認識、またそれを拡張した漢字列認識に対して用いる手法を検討する。
本手法では、文字部品やストローク(画)が成す漢字の階層構造を利用し、全ての手書き漢字が、文字部品間の相対的な位置関係を考慮した確率文脈自由文法(SCFG)で生成できるとした。HMMによる手書きストローク尤度と位置関係尤度の両方を構文木を生成する過程で用いることによって、ストローク形状と位置関係ゆらぎを統合した尤度の精度を向上することが期待できる。漢字列に対しても漢字間の位置関係を確率的に扱うことで、文字境界確定と孤立漢字認識を統合的に処理することができ、境界確定誤りによる認識誤りを補償することができる。
JAISTのオンライン手書き文字データベースの漢字2~3字で構成される熟語について評価したところ、言語モデルを用いずに文字列認識率$90.80\%$を得た。 |
(英) |
In this paper, we discuss a method for online handwritten Kanji character recognition by describing the structure of Kanji using Context-Free Grammar(CFG), and extend it in order to recognize Kanji character strings.
In this approach, we turn attention to the hierarchical structure of Kanji which consist of character-parts and strokes, and consider all character patterns to be generated from stochastic context-free grammar(SCFG). As we use both likelihoods of strokes and position relationship between character-parts in the process of parsing, it is expected that likelihoods of strokes and positions jointly improved the likelihood accuracy.
Using this method on Kanji strings enables the system to deal with both of the main problems together, namely, the decision of boundaries between letters and isolated Kanji character recognition process. Therefore the recognition error due to the failure of letter boundary decision can be compensated.
We evaluated the method using handwritten phrases consist of 2 or 3 Kanji characters contained in JAIST Online Handwriting Database, and gained the recognition rate of 90.80\% without using language models. |
キーワード |
(和) |
オンライン手書き文字認識 / 文字列認識 / サブストロークHMM / 確率文脈自由文法 / 文字部品間の位置関係 / / / |
(英) |
Online Handwriting Recognition / Character String Recognition / Substroke HMM / Spatial Relationship of Subcharacters / Stochastic Context-Free Grammar / / / |
文献情報 |
信学技報, vol. 107, no. 491, PRMU2007-227, pp. 75-80, 2008年2月. |
資料番号 |
PRMU2007-227 |
発行日 |
2008-02-14 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2007-227 |