講演抄録/キーワード |
講演名 |
2004-12-16 10:30
シーン中の文字領域検出における周波数特徴の分析と比較 ○齋藤靖二・後藤英昭・小林広明(東北大) |
抄録 |
(和) |
画像中の文字領域の抽出のために,離散コサイン変換(DCT)やウェーブレット変換などの周波数特徴を用いた手法が幾つか提案されている.
従来の研究では主に最終的な文字抽出精度によって性能の評価が行われているが,特徴量そのものの良さという観点からの分析・比較は不十分であった.
本報告ではDCTとウェーブレット変換をFisherの判別基準に基づき分析・比較し,文字領域抽出に適した特徴量を導出する.
さらに,文字・非文字を分類するための教師無しの閾値設定法を提案する.
実験の結果,Fisherの判別基準による分析・比較を行うことで適切な周波数領域のDCT係数を選択することができ,優れた特徴量を得ることができた.
また,得られた特徴量を用いて文字抽出の実験を行った結果,より高い文字抽出精度が得られた. |
(英) |
Several methods using features in frequency domains obtained by the Discrete Cosine Transformation (DCT) and the Wavelet Transformation have been proposed so far for text region detection in images.
The performances of the methods in the previous work
were evaluated mainly by the final precision of text region extraction.
However, the analyses and the comparisons with respect to the goodness of features themselves have not been so sufficient.
This report proposes an analysis and comparison method using Fisher's discriminant analysis to get a better features and an unsupervised thresholding method to segment text and non-text.
Better features can be obtained by choosing DCT coefficients in an appropriate frequency range.
Experimental results indicate that the final precisions of text region extraction are improved by using the optimized features. |
キーワード |
(和) |
シーン中の文字 / 文字領域抽出 / 離散コサイン変換 / ウェーブレット変換 / Fisherの判別基準 / / / |
(英) |
scene texts / text region detection / Discrete Cosine Transformation / Fisher's discriminant analysis / Wavelet Transformation / / / |
文献情報 |
信学技報, vol. 104, no. 523, PRMU2004-128, pp. 31-36, 2004年12月. |
資料番号 |
PRMU2004-128 |
発行日 |
2004-12-09 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
研究会情報 |
研究会 |
PRMU |
開催期間 |
2004-12-16 - 2004-12-17 |
開催地(和) |
湯布院公民館 |
開催地(英) |
|
テーマ(和) |
ユビキタスコンピューティングのためのパターン認識・メディア理解,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2004-12-PRMU |
本文の言語 |
日本語 |
タイトル(和) |
シーン中の文字領域検出における周波数特徴の分析と比較 |
サブタイトル(和) |
|
タイトル(英) |
Analysis and comparison of frequency features for scene text detection |
サブタイトル(英) |
|
キーワード(1)(和/英) |
シーン中の文字 / scene texts |
キーワード(2)(和/英) |
文字領域抽出 / text region detection |
キーワード(3)(和/英) |
離散コサイン変換 / Discrete Cosine Transformation |
キーワード(4)(和/英) |
ウェーブレット変換 / Fisher's discriminant analysis |
キーワード(5)(和/英) |
Fisherの判別基準 / Wavelet Transformation |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
齋藤 靖二 / Seiji Saitoh / サイトウ セイジ |
第1著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第2著者 氏名(和/英/ヨミ) |
後藤 英昭 / Hideaki Goto / ゴトウ ヒデアキ |
第2著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第3著者 氏名(和/英/ヨミ) |
小林 広明 / Hiroaki Kobayashi / コバヤシ ヒロアキ |
第3著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2004-12-16 10:30:00 |
発表時間 |
30分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2004-128 |
巻番号(vol) |
vol.104 |
号番号(no) |
no.523 |
ページ範囲 |
pp.31-36 |
ページ数 |
6 |
発行日 |
2004-12-09 (PRMU) |