講演抄録/キーワード |
講演名 |
2005-01-21 15:30
文字切出しによらない毛筆手書き文字検索のための部分空間法 ○寺沢憲吾・長崎 健・川嶋稔夫(公立はこだて未来大) |
抄録 |
(和) |
デジタルアーカイブの動きの広まりにより歴史的文書の画像を取り扱う機会が増加しているが,歴史的文書の多くは毛筆手書きで書かれており,従来の文字認識手法を適用することが難しい.その原因のひとつに毛筆手書き文書は文字切出しが困難であることが挙げられる.本研究では文字切出しを前提としない文字検索手法として,文書画像中からある文字列の部分と類似度の高い部分を検出する方法を提案する.文字列画像をスリット状に切出すことにより文字列画像はスリット画像のシーケンスとして表現され,これに部分空間法を適用することにより効率的なマッチングが可能となる.本手法による検索は,単純テンプレートマッチング法と比べて少なくとも同等以の精度が得られる上,計算コストも大幅に削減することができる. |
(英) |
This paper describes a new method for text retrieval which do not use segmentation. In historical document images it is difficult to segment the images into individual symbols, therefore traditional OCR method does not work well. Instead of character segmentation, the proposed method divides the text image into small slit image sequences. By solving matching problem of these sequences, the image region which is corresponding to the query image region is retrieved. Applying subspace method to the slit images makes it possible to solve the matching problem efficiently. Compared with simple template matching method, the proposed method has higher accuracy, and has far higher efficiency with respect to computational cost. |
キーワード |
(和) |
毛筆手書き文書 / 文字切出し / 部分空間法 / / / / / |
(英) |
historical document images / segmentation / subspace method / / / / / |
文献情報 |
信学技報, vol. 104, no. 573, PRMU2004-172, pp. 51-56, 2005年1月. |
資料番号 |
PRMU2004-172 |
発行日 |
2005-01-14 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|