講演抄録/キーワード |
講演名 |
2019-09-28 17:55
宇宙機関連テキストデータの分散表現モデルの比較手法の検討 ○大久保梨思子・倉林 翔・森 健史・波平晃佑・植田泰士・片平真史(JAXA)・天笠俊之(筑波大) NLC2019-28 |
抄録 |
(和) |
本稿では,word2vec で学習した単語の分散表現モデルの質について,実タスクへの適用の前に評価する方法の検討結果を報告する.分散表現モデルの学習結果の良し悪しは,実タスクへ適用した際に確認可能である.しかし,宇宙機開発等の専門知識を要する評価が必要なタスクへ分散表現モデルを適用した場合,評価可能な者が限定されるため評価コストを複数回かけることが難しい.そこで,分散表現モデルの良し悪しを,実タスクへの適用前にある程度の精度で比較評価する方法を検討した.また、分散表現モデルの評価結果と実タスクの精度の相関を調査した. |
(英) |
In this paper, we report the examination result of the method to evaluate the quality of the word-em-bedding models with word2vec before applying them to the actual NLP task. The quality about word-embeddingmodels can be confirmed when applied to a real NLP task. However, when the word-embedding model is applied to tasks that require specialized knowledge for the evaluation, such as spacecraft development, it is difficult to apply
multiple evaluation costs because the number of people who can be evaluated is limited. Therefore, we examined a method to evaluate the quality of the word-embedding models with a certain degree of accuracy before applying it to a real NLP task. We also investigated the correlation between the evaluation result of the word-embedding model and the accuracy of the actual NLP task. |
キーワード |
(和) |
分散表現モデル / word2vec / 専門用語 / / / / / |
(英) |
word-embedding model / word2vec / technical term / / / / / |
文献情報 |
信学技報, vol. 119, no. 212, NLC2019-28, pp. 109-114, 2019年9月. |
資料番号 |
NLC2019-28 |
発行日 |
2019-09-20 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2019-28 |