講演抄録/キーワード |
講演名 |
2016-01-21 15:30
視覚表現を利用した電子帳票のデータ構造変換手法の検討 ○高木郁子・山田光一・丸山 勉(NTT) ICM2015-30 LOIS2015-52 |
抄録 |
(和) |
企業における様々な業務では,組織間または業務担当者間での情報伝達に帳票が利用されている.帳票とは,情報に該当する値(項目値),その値の意味を示す文字列(項目名),項目名と項目値の論理関係を明示的に表現したドキュメントで,例えば,申請書や集計表等がある.帳票の様式の特徴は多種多様であるため,これらの論理関係を機械的に認識することは難しい.そこで,帳票を介する様々な業務を効率化するために,我々は電子帳票を対象に論理関係を自動的に認識し,データ構造に変換する手法を検討している.本論では,塗りつぶし色・正規表現を含む文字列・罫線の種類・太さ等の視覚表現を利用して,ユーザが認識のためのルールを記述できるような設計を提案し,これを実際の業務で利用されている帳票に適用した結果について報告する. |
(英) |
In various works of enterprises, form documents are utilized to communicate information between departments or persons in charge of a work. Form is documents that is written item name and data item name and these logical relation explicitly by using borders form and string, such as application form, spreadsheet. However, since the layout of forms is of great variety, It is difficult to recognize these logical relations mechanically. In order to make efficient various works through electronic forms, we study a method that converts electronic forms to logical relations automatically. In this paper, we will propose a method that correct the borders relations by graphical representation rules expressed as filled color, string including regular expression, borders style, and borders weight and convert logical tree by improved existed method. And furthermore we will examine the accuracy of extract logical relation to actual office electronic forms documents. |
キーワード |
(和) |
帳票認識 / 電子帳票 / 視覚表現ルール / データ構造 / 自働化 / / / |
(英) |
Form Recognition / Electronic Form / Graphical Representation Rule / Data Structure / Automation / / / |
文献情報 |
信学技報, vol. 115, no. 409, ICM2015-30, pp. 25-30, 2016年1月. |
資料番号 |
ICM2015-30 |
発行日 |
2016-01-14 (ICM, LOIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICM2015-30 LOIS2015-52 |
|