講演抄録/キーワード |
講演名 |
2016-09-09 10:50
日本語解析システム「雪だるま」第2報 ~ 進捗報告と活用形態素の導入 ~ ○山本和英・高橋寛治・桾澤優希・西山浩気(長岡技科大) NLC2016-23 |
抄録 |
(和) |
現在我々が構築している日本語解析システム「雪だるま」の進捗について述べる。昨年度は表記統制と形
態素結合処理を中心に辞書整備を行い、広義の表記統制、すなわち同義語、敬語、支援動詞構文についても取り扱っ
た。またひらがな語の一部に対する語義曖昧性解消も提案した。これらはいずれも実装され、一般に公開されている。
今年度は、活用形態素という概念を提案した。活用形態素とは、用言中にある活用情報を用言とは分離して独立の単
語とする考え方で、これによって、(1) 活用情報を損失することなく用言をまとめあげることができ、単語n-gram や
共起表現などの処理を行う上でより有用な情報を獲得できる(2) 日本語教育で行われているように、後続の単語と共
に文法項目を記述することが容易にできる(3) 活用形によって構文的境界を表現している場合に、構文解析を容易に
する、という特長を持つ。 |
(英) |
This paper presents our work on building a Japanese word analyzer, called as SNOWMAN. Since last
year we have been building a dictionary for reducing orthographical variants, and to identify multiple words like
idioms. We have also considered synonyms, honorific expressions, and support-verb expressions as a kind of or-
thographical variants. In this paper we also propose “functional morpheme,” which is a pseudo-morpheme that
represents conjugation information of the verbs and adjectives. We propose to set conjugation information apart
from verbs/adjectives and put it just after the conjugation word. This enables to reduce the variation of the
conjugation words and easier description and analysis of grammar. |
キーワード |
(和) |
形態素解析 / 表記ゆれ / 慣用句 / 活用形態素 / / / / |
(英) |
morphological analysis / orthographical variation / idioms / functional morpheme / / / / |
文献情報 |
信学技報, vol. 116, no. 213, NLC2016-23, pp. 63-68, 2016年9月. |
資料番号 |
NLC2016-23 |
発行日 |
2016-09-01 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2016-23 |