講演抄録/キーワード |
講演名 |
2019-07-14 13:15
単語分散表現の言語研究への利用 ~ 中国語での事例報告 ~ ○王 棟・石田智裕・張 婷・佐野 洋(東京外国語大) TL2019-6 |
抄録 |
(和) |
本稿は,言語学が今後どのようにAI(機械学習や深層学習など)の技術成果を研究課題に活用することができるのかを大きな探求目標として,その先行的試みとして,単語分散表現を生成するツール(word2vec)を用いた中国語の助動詞研究への適用の事例を報告する.
中国語文を用いて単語分散表現モデルを作成した(およそ22億語のデータサイズ).中国語の助動詞の「要」と「会」を取り上げ,当該の助動詞の使い分けについて,作成したモデルの示す単語の散らばり具合から得た表現特徴と,「要」と「会」についての先行研究に基づく分析結果の比較を行った.その結果,言語学における先行研究を支持する特徴が得られたことが分かった.
AI技術を言語研究分野で利活用する事例として報告する.と同時に,本事例(「要」と「会」)を用いた例証)を通じて,従来からの語学研究アプローチとの接点とその概念理解,数学モデルの解釈の仕方について経験を得た.現在,経験したことの整理を行っており,今後,人文系分野におけるAI技術活用の方法論を確立する一助として捉えていきたい. |
(英) |
This paper explores how linguistics can utilize AI technology such as machine learning and deep learning on research subjects in its own field. The author makes use of distributed representation (Word2vec) for the investigation of Chinese auxiliary verbs, building a model of distributed expressions with Chinese sentences (approximately 2.2 billion words). By comparing the expression features of the auxiliary verbs HUI and YAO derived from the word2vec model with the achievements of traditional linguistic research, we find that the representation features from distributed expression support traditional linguistic research. |
キーワード |
(和) |
語彙分散表現 / 中国語学 / 助動詞 / 要と会 / / / / |
(英) |
Word Dispersion Expressions / Chinese Linguistics / Auxiliary Verb / Yao and Hui / / / / |
文献情報 |
信学技報, vol. 119, no. 114, TL2019-6, pp. 31-36, 2019年7月. |
資料番号 |
TL2019-6 |
発行日 |
2019-07-07 (TL) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
TL2019-6 |