講演抄録/キーワード |
講演名 |
2009-10-16 14:50
動詞項構造シソーラスに基づく動詞語義ならびに意味役割付与データの構築 ○竹内孔一・森本真依子(岡山大) NLC2009-9 |
抄録 |
(和) |
文法的構造を基に述語を中心として文の意味を記述する項構造が文の形式的解析
から文の意味を処理するためのインターフェースとして期待されている.項構造
は述語の語義と係り関係にある要素の役割で記述されるフレームであり,項構造
が正しく付与できると,動詞の語義曖昧性解消ならびに同義の言い換えとどの要
素が言い換え可能かまで明らかにすることが期待できる.英語ではすでに項構造
を人手で付与した大規模コーパスが公開され利用されているが,日本語ではEDR
で構築されたものの文書単位で付与されたため学習事例として利用が困難である.
そこで本稿では語義の事例を中心に項構造を付与した意味役割付与データ(120語
の動詞に対して1483文)を構築し,語義付与に起こる問題と現段階での対処につ
いて整理を行う.体系として動詞項構造シソーラスを利用した.項構造を文に付
与することで体系の不備を同時に整理することを目標としている.構築した項構
造タグ付きコーパスは公開する予定である. |
(英) |
Argument structure is widely recognized as an interface of mapping from
grammatical structure of a sentence to shallow semantic structure. In
English several large-scale language resources such as FrameNet,
VerbNet, Propbank, and Dorr's LCS are proposed and each of them defines
a kind of argument structure and some of them construct annotated
corpora. These annotated corpora are very useful to build a statistical
annotation system of semantic role labels. While in Japanese EDR
provided a large-scale annotated corpus of semantic role labels; however
the annotated sentences are not collected on the basis of verbs, thus it
is hard to utilize the annotated corpus as a training corpus of
statistical semantic role label system. Thus we propose another
annotation corpus of argument structure on the basis of the Japanese
Verb Thesaurus which is provided in previous work. Currently we
annotated 1483 sentences for 120 verbs. In this manuscript we confirm
that the problem issues of argument structure annotation, current
annotation scheme, development of tool and quality of annotated corpus. |
キーワード |
(和) |
項構造 / 意味役割 / 動詞語義 / タグ付与コーパス / 動詞項構造シソーラス / / / |
(英) |
Argument structure / Semantic role label / Verb meaning / Annoated corpus / Verb thesaurus / / / |
文献情報 |
信学技報, vol. 109, no. 234, NLC2009-9, pp. 13-18, 2009年10月. |
資料番号 |
NLC2009-9 |
発行日 |
2009-10-09 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-9 |