講演抄録/キーワード |
講演名 |
2018-12-07 15:55
音声による感情推定のための仮想敵対的学習によるモデル平滑化 ○桑原豊明・清 雄一・田原康之・大須賀昭彦(電通大) AI2018-30 |
抄録 |
(和) |
音声による感情推定は深層学習の発展に伴い、より高い精度での推定を可能としている。しかし深層学習を用いた感情推定の多くは教師有学習が用いられており、学習に用いるデータセットを多量に確保することが困難であるといった問題が存在する。
また、訓練データの環境と実際のデータの環境が大きく異なる場合、感情推定の精度が大きく低下してしまうことが課題として考えられている。
そこで、両課題を解決するためのアプローチとして、本研究では半教師学習である仮想敵対的学習(Virtual adversarial training:VAT)を用いて、生成する感情推定モデルの平滑化を行い、モデルの堅牢性向上を図った。VATは学習において微小かつ意図的なノイズを訓練データに加えて、生成モデルの平滑化を行う手法として、機械学習での注目が高まっている。初めにシングルコーパスによる検証によりVATにおけるハイパーパラメータを設定し、次にクロスコーパスによる評価実験を行うことにより生成したモデルの堅牢性向上を示した。 |
(英) |
The emotion estimation by speech makes it possible to estimate with higher precision with the development of deep learning. However, most of the emotion estimation using deep learning is using supervised learning, and there is a problem that it is difficult to secure a large amount of data set used for learning.
In addition, when the training data environment and the actual data environment are significantly different, it is considered as a problem that the accuracy of emotion estimation greatly deteriorates.
Therefore, as an approach to solve both problems, in this research, smoothing of the generated emotion estimation model is performed using virtual adversal training (VAT), semi-teacher learning, and the robustness of the model Improvement was aimed. VAT attracts attention in machine learning as a method of smoothing a generation model by adding minute and intentional perturbation to training data in learning. We first showed improvement of robustness of model generated by setting hyperparameter in VAT by verification with single corpus and then performing evaluation experiment with cross corpus. |
キーワード |
(和) |
深層学習 / クロスコーパス / 仮想敵対訓練 / 感情認識 / 音声処理 / / / |
(英) |
Deep Learning / Cross Corpus / Virtual Adversarial Training / Emotion Recognition / Speech Processing / / / |
文献情報 |
信学技報, vol. 118, no. 350, AI2018-30, pp. 25-29, 2018年12月. |
資料番号 |
AI2018-30 |
発行日 |
2018-11-30 (AI) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2018-30 |