講演抄録/キーワード |
講演名 |
2021-09-16 09:35
利用規約中の不公平文検出におけるGAN-BERTの利用 ○近藤 匠・小川泰弘・外山勝彦(名大) NLC2021-7 |
抄録 |
(和) |
オンラインサービス利用規約は条文が多いため,ユーザが読み飛ばす傾向にあるが,利用者にとって不公平になり得る条文が含まれる場合がある.これをユーザが効率的に確認するために,利用規約内の不公平文の自動検出を行う.先行研究では,日本語利用規約における自動検出に対して線形SVMを利用し,さらに分類性能向上のために,学習データの不均衡性解消を目的としたアンダーサンプリングを行った.しかし,その分類性能は十分であるとは言えない.
本稿では,BERTを半教師ありGANによって拡張した学習モデルであるGAN-BERTを利用し,少量のラベル付き利用規約と,入手が比較的容易なラベル無し利用規約を学習に使用することにより,より高い分類性能を達成したことを示す. |
(英) |
Although the terms of service (ToS) tend to be skipped because of their large number of articles, some of them may be potentially unfair to users. In this paper, we propose a method for automatically detecting unfair articles in ToS so that users can check them efficiently.
The previous studies used linear SVM for the automatic detection in Japanese ToS, and it performed undersampling to eliminate imbalance in the training data to improve classification performance. However, the classification performance is not satisfactory.
In this paper, we use GAN-BERT, a learning model that extends BERT with semi-supervised GANs, to use a small number of labeled ToS and easily available unlabeled ToS for training, and show higher classification performance. |
キーワード |
(和) |
利用規約 / 不公平文 / GAN-BERT / / / / / |
(英) |
Terms of Service / Unfair article / GAN-BERT / / / / / |
文献情報 |
信学技報, vol. 121, no. 178, NLC2021-7, pp. 5-10, 2021年9月. |
資料番号 |
NLC2021-7 |
発行日 |
2021-09-09 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2021-7 |