講演抄録/キーワード |
講演名 |
2018-12-12 16:30
参照データとidfを利用した事前採点不要な小論文評価手法 ○大野雅幸・竹内孔一・泉仁宏太・小畑友也・田口雅弘・稲田佳彦・飯塚誠也・阿保達彦・上田 均(岡山大) NLC2018-33 |
抄録 |
(和) |
大学入試において2020年から記述式問題が導入されることから記述式の問題を自動で採点する手法の開発が求められている.本論では,エッセイタイプの小論文課題を対象に,課題に関連する参照データとWikipedia全文から作成したidfを利用した事前採点不要な自動採点手法を提案する.先行研究において,日本語小論文を対象とした自動採点では,多くの事前採点が必要となり,実際の数百人規模の試験では利用することが難しいと考えられる.そこで本研究では,事前採点が不要な小論文採点手法を提案する.また,小論文の模擬試験を実施して小論文データを構築する.構築した小論文データに対して採点手法を用い,実験を行い評価する.また小論文データの人手による採点に対しても評価を行う.評価実験の結果neologd辞書を利用した形態素解析器を用いて, idf値を利用した形態素の一致数が,人手の評価値と相関が高いことを示す. |
(英) |
In this paper, we describe an on-going study of developing an
automatic essay-scoring system in Japanese. Essay scoring systems have
already been developed and used mainly in English, while not many
previous studies have been done on Japanese essay evaluations. Most
of the methods and systems of automatic essay evaluation need not
small number of previously human-graded essays for calibrating the
parameter of regression functions or parameter of machine learning.
The previous studies show the high performance for essay evaluation
task, however, it must be not easy to assume large graded essays in,
for example, actual tests or entrance examinations. Thus, we take a
approach to evaluate Japanese essays without previously human-graded
essays but with assuming reference data related to essay questions.
The proposed method is a simple one, that is, evaluating the essays
with co-occurrences with the reference data in their words or
morphemes. In the method technical terms would be given high scores
using neologd dictionary and idf values.
Experimental results show that the proposed method works well in our
developing Japanese mock trial writing tests. |
キーワード |
(和) |
自動採点 / アノテーション / 採点支援 / idf / neologd / / / |
(英) |
automatic scoring of essays / human annotation, supporting system of essay evaluation / idf / neologd / / / / |
文献情報 |
信学技報, vol. 118, no. 355, NLC2018-33, pp. 103-108, 2018年12月. |
資料番号 |
NLC2018-33 |
発行日 |
2018-12-04 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
NLC2018-33 |