講演抄録/キーワード |
講演名 |
2016-10-20 15:40
ディープラーニングによる日本語の歴史的典籍におけるくずし字の認識およびWWWアプリケーション開発の試み ○早坂太一・大野 亙・加藤弓枝(豊田高専)・山本和明(国文学研究資料館) PRMU2016-93 |
抄録 |
(和) |
国文学研究資料館古典籍共同研究事業センターにより構築が進められている「日本語の歴史的典籍データベース」を有効活用することで,異分野を融合させた研究の展開も期待されるが,いかに資料が集積されたとしても,そこに書かれている文字が「くずし字」であるがために,その専門的知識が少ない研究者にとっては障壁となる.本研究は,世界的に注目されている人工知能技術である,ディープラーニングを用いたくずし字の自動翻刻システムの構築を目的とする.オープンデータとして公開されているいくつかの歴史的典籍に対して,人工知能による認識の精度を算出するとともに,学習したモデルをWWWアプリケーションとして実装することで,その翻刻に要する時間についても考察を行った. |
(英) |
Effective utilization of “Pre-modern Japanese book database” constructed by the project supervised by Center for Collaborative Research on Pre-Modern Texts, NIJL will push forward the development of the interfiled study. It may become obstruction for the researchers with a little knowledge of classical literature, however, because historical Japanese texts have been written by Kuzushiji (Hentaigana and cursive script). In this article we report an attempt of recognizing Hentaigana by deep learning, which is the artificial intelligence technology regarded throughout the world. Using the convolutional neural networks, we obtained a rate of correct distinction of Hentaigana in several pre-modern texts in open database. Furthermore, we developed the WWW software application and evaluated the time to recognize Hentaigana. |
キーワード |
(和) |
くずし字(変体仮名) / 自動翻刻 / ディープラーニング / 文字認識 / WWWアプリケーション / / / |
(英) |
Kuzushiji (Hentaigana) / Machine reprinting / Deep learning / Character recognition / WWW application / / / |
文献情報 |
信学技報, vol. 116, no. 259, PRMU2016-93, pp. 15-18, 2016年10月. |
資料番号 |
PRMU2016-93 |
発行日 |
2016-10-13 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2016-93 |
|