講演抄録/キーワード |
講演名 |
2014-03-13 11:45
大規模日本語情景文字データセット OPU-JST-1 ○佐藤 瞳・松田崇宏・池田佑輝・岩村雅一・黄瀬浩一(阪府大) PRMU2013-176 |
抄録 |
(和) |
スマートフォンやタブレットなどの小型端末の普及が進んでいることから,それらを用いた様々な情景中の文字を認識するサービスやアプリケーションの需要が高まっている.情景中の文字は多種多様な形状を持ち,撮影時に射影歪みや照明環境の影響を受ける.解像度が低下する場合もある.そのため,これらの文字の検出・認識は,スキャナで撮像した場合など,撮像環境をコントロールした場合よりも困難である.この問題に対処する有効な方法と考えられているのが,種々の劣化を受けた文字データを大量に集めて,識別器の学習に使用することである.データセットの作成には,撮影,ラベル付けの作業が必要となる.しかし,特にラベル付け作業の人的コストが高いため,大規模なデータセットの構築は困難な課題となっている.本研究では全方位カメラを用いて商店街などを撮影し,得られた画像からなる情景中の日本語文字データセット,OPU-JST-1を構築したので,それを報告する.このデータセットは,時系列情報を持つ情景画像31,410枚からなり,790,257個のテキスト領域のラベルと,2,764,230個の文字を持っている. |
(英) |
(Not available yet) |
キーワード |
(和) |
パターン認識 / 大規模データベース / 情景中文字 / 日本語 / 動画 / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 113, no. 493, PRMU2013-176, pp. 49-54, 2014年3月. |
資料番号 |
PRMU2013-176 |
発行日 |
2014-03-06 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2013-176 |