講演抄録/キーワード |
講演名 |
2010-02-19 15:30
回帰的遷移ネットワークを用いた文字経路探索方式の開発 ○高橋寿一・永崎 健・古賀昌史(日立) PRMU2009-231 |
抄録 |
(和) |
OCR(光学的文字認識装置)において,自由文脈文法を用いた回帰遷移ネットワーク型の文字列辞書と,文字切出しおよび文字識別の曖昧性を保持したネットワークを用いた,いわゆる第3.5世代と呼ばれる回帰的遷移ネットワーク型文字列照合方式を開発した.これは文字の切出し方に関して,複数の切出し仮説を残したまま文字識別し,文字列情報を利用して尤もらしい切出し方を決定し文字列を認識する方式である.文字の切出し方の複数の候補は,ネットワーク形式で表現し,切出し方の決定は,ネットワーク中の経路探索問題として解かれる.従来の文字列照合方式では,使用する文字列情報は階層型の形式で記憶していた.しかし,この方式では,辞書容量の制約により,何百万という表記が存在する地域では全てを表現できなかった.そこで小容量で全ての表記を表現できる回帰ネットワーク型の形式で文字列情報を記憶できる辞書を採用した,新しい文字列照合方式を開発した.この異なる2つのネットワークをアクセスし,その状態を保持するために探索木の集合である探索林を用いた.また,計算機のメモリ空間を有効に使用できるように,文字列照合の際に作る探索木を枝刈りする方式も開発した. |
(英) |
We have developed a novel linguistical matching method (called "3.5 generation RTN matching") operated on context free grammar and recognition hypothesis network. The OCR can identify character recognition result using this matching method and linguistical dictionary. This method treats two types of graph model. First is recognition hypothesis network which made from handwritten or printed character string image. The recognition hypothesis network represents segmentation hypothesis and character recognition candidates as directed graph model. Second is recursive transition network (RTN) representing context free grammar. In the conventional linguistical matching method, linguistical dictionary such as address notation was stored as word set having hierarchical structure. It was suitable for small address dictionary, but not for high-complex address such as Kyoto city including huge number of address variation. This method uses RTN as linguistical dictionary to reduce dictionary size. The linguistical matching algorithm must collate two types of graph structure under the limitation of memory size and computational resource. To solve this problem, we have expanded the search tree concept into the search forest (a set of search tree) and developed an effective branch-cutting method for the search forest. |
キーワード |
(和) |
OCR / 文字列認識 / 回帰的遷移ネットワーク / 探索林 / / / / |
(英) |
OCR / Word Matching / Recursive Transition Network / Search Tree / / / / |
文献情報 |
信学技報, vol. 109, no. 418, PRMU2009-231, pp. 141-146, 2010年2月. |
資料番号 |
PRMU2009-231 |
発行日 |
2010-02-11 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2009-231 |
|