講演抄録/キーワード |
講演名 |
2012-09-02 14:45
画像編集により挿入されたテキスト領域の検出 ○平野廣美(楽天)・岡部 誠(電通大/JST) PRMU2012-37 IBISML2012-20 |
抄録 |
(和) |
画像編集ツールの充実により,誇大表現となるテキストが画像内に埋め込まれる例が増加している.大量の画像を扱うサイバーモール企業では重要な問題である.本論では,既存の画像に対して画像編集により埋め込まれたテキスト領域を検知するための新たな手法を提案する.従来から,OCRが文字のコード化を目的に,画像中のテキストを認識するための技術として使われてきたが,われわれの目的は,テキスト領域の有無に関し,前景(テキスト領域)と背景(それ以外)の2値分類を行うことである.テキスト領域では,コーナー特徴点が,水平,垂直,斜め方向に整列して現れるという観測結果から,整列単位をSupercornerと呼ぶ細長い短冊状にまとめ,そのSupercornerをノードとしたグラフを構成する.テキスト領域の特徴をノード間の関係重みとして与え,グラフカットを適用することで2値分類を実現した.また,文字サイズの多様性に対処するために多重解像度解析を用いている.その結果,任意に抽出した弊社サイト内の画像に対して,適合率66%,再現率86%で目的のテキスト領域特定ができた. |
(英) |
Traditionally, Optical Character Recognition (OCR) technologies have been applied to recognize texts embedded in an image. In order to conduct more precise recognition, the text area localization preprocessing has been proposed. Efficiently identifying text areas are inserted to an original image is an important task for e-commerce companies which handle numerous images. Generally, the text area localization is a computationally intensive process. We propose a novel approach to localize such text area efficiently as follows. First, local feature points (using FAST algorithm) that are closely positioned together on a near-straight line are grouped together, which is named as “Supercorner”. Then a graph is created by connecting the centers of each supper corner and two terminal nodes added vertically to the image plane and each connecting cost is given as likelihood of the text area. By applying graph cut algorithm to this created graph allows separation of the text area from background. Here, to handle the diversity of font size, multi resolution analysis is also has been used. This technique achieved satisfactory results with 66% precision and 86% recall. |
キーワード |
(和) |
OCR / Supercorner / 局所特徴量 / FAST / グラフカット / テキスト領域検知 / 多重解像度解析 / |
(英) |
OCR / Supercorner / local feature / FAST / graph cut / text area localization / multi resolution analysis / |
文献情報 |
信学技報, vol. 112, no. 197, PRMU2012-37, pp. 49-56, 2012年9月. |
資料番号 |
PRMU2012-37 |
発行日 |
2012-08-26 (PRMU, IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2012-37 IBISML2012-20 |
研究会情報 |
研究会 |
PRMU IBISML IPSJ-CVIM |
開催期間 |
2012-09-02 - 2012-09-03 |
開催地(和) |
東京農工大 |
開催地(英) |
|
テーマ(和) |
コンピュータビジョンとパターン認識のための機械学習および企業ニーズセッション |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2012-09-PRMU-IBISML-CVIM |
本文の言語 |
日本語 |
タイトル(和) |
画像編集により挿入されたテキスト領域の検出 |
サブタイトル(和) |
|
タイトル(英) |
Detection of Text Area Inserted by Image Editing |
サブタイトル(英) |
|
キーワード(1)(和/英) |
OCR / OCR |
キーワード(2)(和/英) |
Supercorner / Supercorner |
キーワード(3)(和/英) |
局所特徴量 / local feature |
キーワード(4)(和/英) |
FAST / FAST |
キーワード(5)(和/英) |
グラフカット / graph cut |
キーワード(6)(和/英) |
テキスト領域検知 / text area localization |
キーワード(7)(和/英) |
多重解像度解析 / multi resolution analysis |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
平野 廣美 / Hiromi Hirano / ヒラノ ヒロミ |
第1著者 所属(和/英) |
楽天技術研究所 (略称: 楽天)
Raluten Institute of Technology (略称: RIT) |
第2著者 氏名(和/英/ヨミ) |
岡部 誠 / Makoto Okabe / オカベ マコト |
第2著者 所属(和/英) |
電気通信大学 情報理工学部 総合情報学科/科学技術振興機構さきがけ (略称: 電通大/JST)
The University of Electro-Communications/Japan Science and Technology Agency PRESTO (略称: UEC/JST) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2012-09-02 14:45:00 |
発表時間 |
30分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2012-37, IBISML2012-20 |
巻番号(vol) |
vol.112 |
号番号(no) |
no.197(PRMU), no.198(IBISML) |
ページ範囲 |
pp.49-56 |
ページ数 |
8 |
発行日 |
2012-08-26 (PRMU, IBISML) |