講演抄録/キーワード |
講演名 |
2007-10-26 11:00
情景内カラー文字の最適2値化と変形耐性認識の検討 ○横林 実・若原 徹(法政大) PRMU2007-110 |
抄録 |
(和) |
情景内カラー文字の最適2値化では,大津基準を用いたRGBカラー空間での最適投影軸の選定による2クラス分類と画像枠部分での黒白比率と文字らしさの条件を用いた図と地の判定による2値文字の抽出を行う手法を提案する.様々な字体やぼけ・歪みを含む2値文字の変形耐性認識ではGAT相関法と接距離を適用する.ICDAR2003 robust OCR dataset から情景内カラー文字画像698枚を使用して2値化および認識の性能評価実験を行い,現状レベルと残された課題を考察する.また,位置と大きさの正規化処理では吸収できない回転変形の耐性について,-45度~+45度回転したテンプレート画像間のマッチング実験よりGAT相関法の優位性を示す. |
(英) |
The proposed method of optimal binarization of color characters in scene images is based on selection of one optimal projection axis in the RGB color space using Otsu’s criterion and decision between figure and background using the black-white ratio along the image periphery and common characteristics of characters. Regarding distortion-tolerant recognition of binarized characters we compare our global affine transformation (GAT) correlation method against the well-known tangent distance. Experiments are made on a total of 698 character images extracted from the ICDAR 2003 robust OCR dataset, and we discuss the state-of-the-art and remaining problems. Also, against rotation ranging from -45 degrees to +45 degrees as applied to template images the GAT correlation method is found to be much robuster than the tangent distance. |
キーワード |
(和) |
最適2値化 / 大津基準 / 変形耐性マッチング / 接距離 / GAT相関 / / / |
(英) |
Optimal binarization / Otsu's criterion / Distortion-tolerant matching / Tangent distance / GAT correlation / / / |
文献情報 |
信学技報, vol. 107, no. 281, PRMU2007-110, pp. 105-110, 2007年10月. |
資料番号 |
PRMU2007-110 |
発行日 |
2007-10-18 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2007-110 |