講演抄録/キーワード |
講演名 |
2023-03-18 10:45
化学工学関連論文中のNomenclatureに基づく変数定義予測手法 ○加藤祥太・加納 学(京大) NLC2022-21 |
抄録 |
(和) |
製造業における物理モデル構築に要する多大な労力を削減するために,著者らは文献情報から物理モデルを自動で構築するシステム(Automated physical model builder; AutoPMoB)の実現を目指している.本研究では,AutoPMoBの実現に必要な要素技術の1つである文献からの変数定義抽出技術の開発に取り組む.化学プロセス関連論文には変数記号と変数定義の一覧であるNomenclatureが含まれる場合があるが,Nomenclatureが存在しない場合には文中から変数定義を正確に抽出する必要がある.本研究では変数定義抽出対象の論文以外に含まれるNomenclatureが変数定義抽出に有用か否かを検証した.入力の形式を変更しながら複数のBERTをファインチューニングして変数記号-変数定義ペアの正誤を判定した結果,XML形式の変数記号を入力した場合が最高の性能(Precision: 0.955,Recall: 0.646)を達成した.さらなる精度向上には,論文の分野や変数の周りのテキストなど,変数記号と定義以外の情報を入力する方法や前処理方法の工夫が必要である. |
(英) |
Digital twins require a physical model, but physical model building requires significant effort. To streamline the arduous task, we aim to develop a system that automatically builds physical models from literature databases. This study investigated whether the performance of variable definition extraction can be improved by incorporating nomenclatures from papers other than the target papers. We fine-tuned multiple BERT models while changing the input format and evaluated which format was most effective in identifying the correct pairs of variable symbols and variable definitions. The best performance (Precision: 0.955, Recall: 0.646) was achieved when variable symbols were input in XML format. |
キーワード |
(和) |
情報抽出 / 化学工学 / 数式言語処理 / 変数定義抽出 / / / / |
(英) |
Information extraction / Chemical engineering / Mathematical language processing / Variable description extraction / / / / |
文献情報 |
信学技報, vol. 122, no. 449, NLC2022-21, pp. 12-15, 2023年3月. |
資料番号 |
NLC2022-21 |
発行日 |
2023-03-11 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2022-21 |
研究会情報 |
研究会 |
NLC IPSJ-NL |
開催期間 |
2023-03-18 - 2023-03-18 |
開催地(和) |
沖縄科学技術大学院大学 |
開催地(英) |
OIST |
テーマ(和) |
言語処理の産業・社会応用、および一般 |
テーマ(英) |
Applications of natural language processing, and etc. |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2023-03-NLC-NL |
本文の言語 |
日本語 |
タイトル(和) |
化学工学関連論文中のNomenclatureに基づく変数定義予測手法 |
サブタイトル(和) |
|
タイトル(英) |
Variable Description Prediction Method Based on Nomenclature in Chemical Engineering Domain Papers |
サブタイトル(英) |
|
キーワード(1)(和/英) |
情報抽出 / Information extraction |
キーワード(2)(和/英) |
化学工学 / Chemical engineering |
キーワード(3)(和/英) |
数式言語処理 / Mathematical language processing |
キーワード(4)(和/英) |
変数定義抽出 / Variable description extraction |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
加藤 祥太 / Shota Kato / カトウ ショウタ |
第1著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto U.) |
第2著者 氏名(和/英/ヨミ) |
加納 学 / Manabu Kano / カノウ マナブ |
第2著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto U.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-03-18 10:45:00 |
発表時間 |
20分 |
申込先研究会 |
NLC |
資料番号 |
NLC2022-21 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.449 |
ページ範囲 |
pp.12-15 |
ページ数 |
4 |
発行日 |
2023-03-11 (NLC) |