講演抄録/キーワード |
講演名 |
2006-02-24 15:00
ストローク単位の確率文脈自由文法を用いたオンライン手書き数式認識 ○山本 遼・酒向慎司・西本卓也・嵯峨山茂樹(東大) |
抄録 |
(和) |
本論文ではオンライン手書き数式認識のための新しい手法を提案する.我々は,手書き数式を,ストローク列を生成する確率文脈自由文法としてモデル化し,数式の文法構造と2 次元構造,シンボル内の構造を全て1 つの文法で統一的に記述する手法を提案する.この手法によりシンボル認識・構造認識・数式文法解析といった独立の認識ステップを経ずに,これらの情報を同時に利用して数式認識を行うことができ,頑健な数式認識が期待できる.
また数式の2 次元構造モデルとして,さまざまな形状の非終端記号を統一的に扱うために,隠れ筆記領域という概念を提案し,これを用いて「シンボル形状に依存しない位置」をモデル化する.このモデルはデータからのパラメタ学習が可能であるため,十分な学習データが存在すれば頑健なモデルとなる期待がある.
同一筆者が入力した,学術論文における中程度複雑さの8 種80 数式による評価実験の結果,数式のシンボル・構造の同時推定によってシンボル分割・認識精度が向上することが確かめられた. |
(英) |
In this paper, we propose a new framework for on-line handwriting mathematical expression recognition.In this approach, we see handwriting mathematical expression as a stroke generation process with grammar. We do not solve 3 major problem in mathematical expression recognition one by one: symbol segmentation/recognition, 2-D structure analysis, and math syntax analysis, rather we estimate the most likely expression candidate derivedfrom a stroke-based stochastic context-free grammar. Experiments of on-line handwriting mathematical expression recognition with 8 math expressions extracted from IEEE transactions, each of them written 10 times by one writer revealed that symbol segmentation error rate and symbol recognition error rate decline with simultaneous estimation of symbol, 2-D structure, and syntax of mathematical expressions. |
キーワード |
(和) |
数式認識 / 文字認識 / オンライン / 手書き / 確率モデル / 確率文脈自由文法 / / |
(英) |
Mathematical Expression Recognition / Character Recognition / On-line / Handwriting / Stochastic Model / Stochastic Context-Free Grammar / / |
文献情報 |
信学技報, vol. 105, no. 615, PRMU2005-221, pp. 111-116, 2006年2月. |
資料番号 |
PRMU2005-221 |
発行日 |
2006-02-17 (TL, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
|