講演抄録/キーワード |
講演名 |
2009-02-19 15:00
[特別講演]帳票認識技術の応用と展開 ○皆川明洋(富士通研) PRMU2008-219 |
抄録 |
(和) |
帳票定義体を使用しない帳票認識(定義体レス認識)技術について述べる.定義体レス認識は,従来の帳票定義体(レイアウト定義体)を必要とする帳票認識技術に代わる認識技術であり,帳票定義体を定義・使用することなく,未知のレイアウト構造を持つ帳票からデータを抽出する技術である.定義体レス認識は,定義体を作成しないというメリットだけでなく,レイアウトが微妙に変化する帳票のように,レイアウト構造に完全に依存しているために従来のシステムでは利用できなかった帳票に対する帳票認識の利用可能性を拡大する.本稿では,当研究所で開発した定義体レス認識技術について述べた後,定義体レス認識と帳票定義体を用いた帳票認識技術との融合,およびそのための共通論理構造選択技術,および部分論理構造認識について述べる. |
(英) |
In this paper, I describe a form recognition technique based on descriptor-less form recognition system. Descriptor-less form recognition system is alternative to conventional form recognition system using layout descriptor, and enables to extract data from unknown/various layout of forms. Descriptor-less form recognition system have a merit to not only use no descriptors, but also explore new types of form: flexible layouts of forms, to which conventional descriptor based form recognition system is not applicable. In this paper, I present three topics: descriptor-less form recognition system, form type discrimination, and its learning system for generic logical structure developed in our laboratory. |
キーワード |
(和) |
帳票認識 / 定義体レス認識 / 論理構造認識 / 文字認識 / レイアウト解析 / / / |
(英) |
Form recognition / Descriptor-less form recognition / Logical structure analysis / Optical character recognition(OCR) / Layout analysis / / / |
文献情報 |
信学技報, vol. 108, no. 432, PRMU2008-219, pp. 69-74, 2009年2月. |
資料番号 |
PRMU2008-219 |
発行日 |
2009-02-12 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2008-219 |