講演抄録/キーワード |
講演名 |
2021-08-22 15:00
多様な自動リーダビリティ判定手法の性能比較と教育的説明性 ○江原 遥(学芸大) HCS2021-32 |
抄録 |
(和) |
自動リーダビリティ判定は、所与のテキストの読みやすさを自動的に判定するタスクであり、難度を考慮した教材検索など様々な応用を持つ基礎タスクである。
古くはFlesch-Kincaidのような回帰式による手法があったが、近年は、ニューラル言語モデルのパープレキシティを使うなど、大きなモデルでテキストの文脈を考慮した手法が提案されている。しかし、こうした新しい手法による性能向上の貢献のどの程度が、個々の単語の難しさなどに還元する手法では捉えられないものなのだろうか?
本稿では、テキストとは関係ない外国語学習者向けの単語テストデータを分析し、外国語学習者にとっての単語の難しさを正確に計算する事で、文脈は考慮しないものの、テキスト中の単語の平均的な難しさをより正確に計算できる簡便な自動リーダビリティ判定手法を提案した。性能の比較実験では、提案手法が、大規模言語モデルのパープレキシティを用いる方法よりも高い性能を示した。文脈を用いる事よりも学習者にとっての難しさを正確に計測した方が有益であるなど、教育的説明性の観点から実験結果を考察する。 |
(英) |
This paper compares methods to measure text readability. |
キーワード |
(和) |
リーダビリティ / 機械学習 / 語彙 / / / / / |
(英) |
Readability / / / / / / / |
文献情報 |
信学技報, vol. 121, no. 143, HCS2021-32, pp. 84-89, 2021年8月. |
資料番号 |
HCS2021-32 |
発行日 |
2021-08-14 (HCS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HCS2021-32 |