講演抄録/キーワード |
講演名 |
2021-03-04 15:00
[ポスター講演]OCRのための書き込み済み印刷書類における手書きの要素と印刷文字の分離手法 ○櫻井亮太朗・日置尋久(京大) EMM2020-73 |
抄録 |
(和) |
書き込みが加えられた印刷書類にOCRを適用する際には、一般に前処理で手書き要素と印刷文字を分離しておくことが求められる。そこで本研究では、書き込み済みの印刷書類内で両者を分離する手法を検討した。提案手法では、手書き要素と印刷文字を判別、分離した後、両者が重なっていた箇所で印刷文字に生じる欠損をInpaintingとモルフォロジー変換によ り修復する。本研究では20枚の書き込み済み英語論文画像で実験を行い、印刷文字のOCR認識率で提案手法を評価した。その結果、書き込みのある文書ではOCR認識率が平均約60%であったのに対して、提案手法の適用後はOCR認識率が平均約95%まで向上した。 |
(英) |
In applying OCR to documents with handwritings, printed texts and handwritings have to be separated from each other. We propose a separation method for this purpose. In our method, we first identify printed texts and handwritings in a document and separate them. We would then find the former is damaged by the latter where they intersect. We restore the printed texts through an Inpainting method and a morphological operation. We have evaluated our method by the OCR recognition rate of printed texts using twenty images of English papers with handwritings. The average OCR recognition rate has been improved from about 60% to 95% before and after applying our method. |
キーワード |
(和) |
OCR / 文書画像 / 書き込み要素 / 画像修復 / / / / |
(英) |
OCR / Document Image / Handwritings / Image Inpainting / / / / |
文献情報 |
信学技報, vol. 120, no. 418, EMM2020-73, pp. 34-39, 2021年3月. |
資料番号 |
EMM2020-73 |
発行日 |
2021-02-25 (EMM) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EMM2020-73 |
研究会情報 |
研究会 |
EMM |
開催期間 |
2021-03-04 - 2021-03-05 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
画質・音質評価,知覚・認知メトリクス,人間視聴覚システム,一般 |
テーマ(英) |
Image and Sound Quality, Metrics for Perception and Recognition, Human Auditory and Visual System, etc. |
講演論文情報の詳細 |
申込み研究会 |
EMM |
会議コード |
2021-03-EMM |
本文の言語 |
日本語 |
タイトル(和) |
OCRのための書き込み済み印刷書類における手書きの要素と印刷文字の分離手法 |
サブタイトル(和) |
|
タイトル(英) |
A Separation Method for Handwritings and Printed Texts on Documents as a Preprocessing Filter for OCR |
サブタイトル(英) |
|
キーワード(1)(和/英) |
OCR / OCR |
キーワード(2)(和/英) |
文書画像 / Document Image |
キーワード(3)(和/英) |
書き込み要素 / Handwritings |
キーワード(4)(和/英) |
画像修復 / Image Inpainting |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
櫻井 亮太朗 / Ryotaro Sakurai / サクライ リョウタロウ |
第1著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.) |
第2著者 氏名(和/英/ヨミ) |
日置 尋久 / Hirohisa Hioki / ヒオキ ヒロヒサ |
第2著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2021-03-04 15:00:00 |
発表時間 |
15分 |
申込先研究会 |
EMM |
資料番号 |
EMM2020-73 |
巻番号(vol) |
vol.120 |
号番号(no) |
no.418 |
ページ範囲 |
pp.34-39 |
ページ数 |
6 |
発行日 |
2021-02-25 (EMM) |