講演抄録/キーワード |
講演名 |
2020-03-11 15:40
光学的文字認識を活用した植物標本画像のラベル自動マスキング方法の検討 ○日野 遥・檜垣泰彦(千葉大) LOIS2019-66 |
抄録 |
(和) |
故萩庭氏らが収集した萩庭植物標本は,収録数・標本の採集地の両面において国内最大規模であり,デジタル・スカラシップ開発の一環で運用を開始した千葉大学学術リソースコレクション(c-arc)での公開が予定されている。しかし絶滅危惧種の収録や,活字と手書き文字が混在した詳細な採集地の記載などがみられ, IIIF・RightStatements を採用するシステムで公開するには資源保護の観点で懸念がある。
そこで今回は,標本画像中に記載された採集地の部分を自動的に検出・マスキングする方法に関して,光学的文字認識(Optical Character Recognition)を中心に検討した。検討の結果,OCR エンジンはCloud Vision API を利用することとし,画像を含めたパラメータについても絞り込むことができた。マスキング範囲の決定に関しては若干の調整は必要であるが,マスキング処理を自動的に行うめどが立った。 |
(英) |
The Haginiwa plant specimen images, are one of the largest collection of flowering plants in Japan, are expected to be published at Chiba University Academic Resource Collections (c-arc) that adopts IIIF and Right Statements. However, there is concern about resource conservation that endangered species are recorded in the collection, and detailed collection sites are described.
In this study, we focused on optical character recognition (Optical Character Recognition), which is a method for automatically detecting and masking the collection area described in the sample image. We mainly use “Cloud Vision API” for OCR, and refined parameters including images itself.
As a result of study, the masking area determination algorithm needs some adjustment, but we obtained the prospect of performing masking automatically. |
キーワード |
(和) |
植物標本画像 / 光学的文字認識(OCR) / 自動マスキング / デジタル・スカラシップ開発 / / / / |
(英) |
Plant Specimen Images / Optical Character Recognition (OCR) / Automatic Masking / Digital Scholarship Development / / / / |
文献情報 |
信学技報, vol. 119, no. 477, LOIS2019-66, pp. 57-62, 2020年3月. |
資料番号 |
LOIS2019-66 |
発行日 |
2020-03-04 (LOIS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
LOIS2019-66 |
研究会情報 |
研究会 |
LOIS |
開催期間 |
2020-03-11 - 2020-03-12 |
開催地(和) |
大濱信泉記念館(石垣島) |
開催地(英) |
Nobumoto Ohama Memorial Hall |
テーマ(和) |
ライフログ活用技術、オフィスインフォメーションシステム、ライフインテリジェンス、および一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
LOIS |
会議コード |
2020-03-LOIS |
本文の言語 |
日本語 |
タイトル(和) |
光学的文字認識を活用した植物標本画像のラベル自動マスキング方法の検討 |
サブタイトル(和) |
|
タイトル(英) |
Investigating of automatic label masking methods for plant specimen images using Optical Character Recognition |
サブタイトル(英) |
|
キーワード(1)(和/英) |
植物標本画像 / Plant Specimen Images |
キーワード(2)(和/英) |
光学的文字認識(OCR) / Optical Character Recognition (OCR) |
キーワード(3)(和/英) |
自動マスキング / Automatic Masking |
キーワード(4)(和/英) |
デジタル・スカラシップ開発 / Digital Scholarship Development |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
日野 遥 / Haruka Hino / ヒノ ハルカ |
第1著者 所属(和/英) |
千葉大学 (略称: 千葉大)
Chiba University (略称: Chiba Univ.) |
第2著者 氏名(和/英/ヨミ) |
檜垣 泰彦 / Yasuhiko Higaki / |
第2著者 所属(和/英) |
千葉大学 (略称: 千葉大)
Chiba University (略称: Chiba Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2020-03-11 15:40:00 |
発表時間 |
25分 |
申込先研究会 |
LOIS |
資料番号 |
LOIS2019-66 |
巻番号(vol) |
vol.119 |
号番号(no) |
no.477 |
ページ範囲 |
pp.57-62 |
ページ数 |
6 |
発行日 |
2020-03-04 (LOIS) |