講演抄録/キーワード |
講演名 |
2018-12-21 16:25
Bi-directional LSTM-CNN-CRFによる参考文献書誌情報抽出 ○浪越大貴・太田 学(岡山大)・高須淳宏・安達 淳(NII) DE2018-23 |
抄録 |
(和) |
膨大な文書が格納されている電子図書館の運用には,書誌情報データベースの整備が必須である.特に学術論文の参考文献欄には著者名やタイトルなどの有用な書誌情報が集約されているため,参考文献文字列から書誌情報を自動抽出する研究が行われている.
本研究では,系列ラベリングタスクで高精度を達成しているBi-directional LSTM-CNN-CRF(BiLSTM-CNN-CRF)を拡張したモデルを用いて,参考文献文字列から書誌情報を抽出する.2雑誌の参考文献文字列から書誌情報を抽出する実験を行い,書誌情報抽出精度を評価した. |
(英) |
The effective use of digital libraries demands maintenance of bibliographic databases. Useful bibliographic information appears in the reference fields of academic papers, so much research has been to develop automatic extraction methods of bibliographic information from them. In this paper, we extract bibliographic information from reference strings using bi-directional LSTM-CNN-CRF (BiLSTM-CNN-CRF), which achieves high accuracy in sequence labeling tasks. We evaluated extraction accuracies by experiments where we extracted bibliographic information from the reference strings collected from two academic journals. |
キーワード |
(和) |
書誌情報抽出 / ニューラルネットワーク / BiLSTM-CNN-CRF / 参考文献文字列 / / / / |
(英) |
Bibliography Extraction / Neural Network / BiLSTM-CNN-CRF / Reference String / / / / |
文献情報 |
信学技報, vol. 118, no. 377, DE2018-23, pp. 17-22, 2018年12月. |
資料番号 |
DE2018-23 |
発行日 |
2018-12-14 (DE) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2018-23 |