講演抄録/キーワード |
講演名 |
2018-12-13 14:55
CTC-VATのための高速事後分布平滑化手法及びその文字列認識への応用 ○田中遼平・小野聡一郎・古畑彰夫(東芝デジタルソリューションズ) PRMU2018-80 |
抄録 |
(和) |
半教師あり学習では,学習データとその近傍点での事後確率の分布間距離を最小化することで事後確率分布を平滑化するVirtual Adversarial Training(VAT)の有効性が確認されている.しかし,音声認識や文字列認識などのConnectionist Temporal Classification (CTC)を用いた系列の認識では,候補となるラベル列の組み合わせが膨大なため,事後確率分布及びそれらの分布間距離の計算のコストが高く,VATを適用することは難しかった.本研究では,事後確率の分布間距離の上界となる値を最小化することで,低コストで事後確率分布を平滑化する高速事後分布平滑化手法を提案する.その応用として文字列認識を対象とした半教師あり学習実験を行い,平易な半教師あり学習手法であるself-trainingと比較して35%程度精度が向上することを確認した. |
(英) |
Virtual Adversarial Training (VAT), which smooths posterior distribution by minimizing distributional distance of posterior probabilities between training data and their neighborhoods, achieves success in semi-supervised learning. However, it is difficult to apply VAT to sequential label predictions such as speech recognition and text line recognition because there are so many possible label sequences that calculating posterior distributions and the distributional distance between them is costly. In this research, we propose a fast distributional smoothing method which minimizes an upper bound of the distributional distance. Furthermore, an experiment on text line recognition showed that VAT with fast distributional smoothing improved prediction accuracies by approximately 35% compared to simple self-training. |
キーワード |
(和) |
Connectionist Temporal Classification / Virtual Adversarial Training / 半教師あり学習 / 文字列認識 / / / / |
(英) |
Connectionist Temporal Classification / Virtual Adversarial Training / Semi-supervised Learning / Text Line Recognition / / / / |
文献情報 |
信学技報, vol. 118, no. 362, PRMU2018-80, pp. 29-34, 2018年12月. |
資料番号 |
PRMU2018-80 |
発行日 |
2018-12-06 (PRMU) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2018-80 |