講演抄録/キーワード |
講演名 |
2019-08-28 17:00
マルチラベル感情表出推定に基づく音声感情分類 ○安藤厚志・増村 亮・神山歩相名・小橋川 哲・青野裕司(NTT) SP2019-16 |
抄録 |
(和) |
本稿では,感情の曖昧性を考慮した新しい音声感情分類手法を提案する.一般的な感情分類手法では各発話が支配的な感情クラス(主感情)のみを含むと仮定して感情分類モデルの学習を行うが,実際には発話に含まれる感情には曖昧性があり,主感情以外の感情クラス(副感情)も含む発話が存在することが指摘されている.この曖昧性を無視して感情分類モデルの学習を行う場合,感情分類精度が低下する恐れがある.曖昧性を感情分類に利用する手法としてソフトターゲットに基づく手法などが提案されているが,ソフトターゲットは発話に表れる全ての感情の出現割合を推定させる手法であり,この学習は困難である.そこで本稿では,各感情の表出のみをまず判定し,その結果に基づいて主感情分類や感情出現割合の推定を行うような分類モデルを構築する新しい感情分類手法を提案する.提案手法では,各感情が表出しているか否かだけを解くことは各感情の出現割合を推定するよりも容易であり,また各感情の表出情報から容易に主感情が特定できると仮定する.提案手法では分類モデルの学習を二段階に分けて行う.始めに,発話ごとに各感情が表出しているか否かを推定するマルチラベル感情表出推定モデルを学習する.次に,マルチラベル感情表出推定モデルの中間出力から主感情を推定する感情分類モデルを再学習する.評価実験により,提案手法は従来の感情分類手法に比べて分類精度が向上することを示す. |
(英) |
This paper presents a novel speech emotion classification that addresses the ambiguous nature of emotions in speech. Most conventional methods assume there is only a single ground truth, the dominant emotion, though utterances can contain minor emotions. These mismatch yields performance degradation. In order to solve this problem, several methods that consider ambiguous emotions~(e.g.~soft-target training) have been proposed. Unfortunately, training them is difficult since they work by estimating the proportions of all emotions. The proposed method improves both frameworks by assessing the presence or absence of each emotion before specifying the dominant. We expect that it is much easier to estimate just presence/absence of emotions rather than trying to determine proportions of each, and the deliberate assessment of emotion existence information will help to estimate the proportion of each or dominant class more precisely. The proposed method employs two-step training. Multi-Label Emotion Existence~(MLEE) model is trained first to estimate whether each emotion is present or absent. Then, the dominant emotion recognition model with hard- or soft-target labels is trained by means of the intermediate outputs of the MLEE model. Experiments demonstrate that the proposed method outperforms both hard- or soft-target based conventional emotion recognition schemes. |
キーワード |
(和) |
感情分類 / マルチラベル分類 / 畳み込みニューラルネットワーク / スペクトログラム / / / / |
(英) |
emotion recognition / multi-label classification / convolutional neural network (CNN) / spectrogram / / / / |
文献情報 |
信学技報, vol. 119, no. 188, SP2019-16, pp. 39-44, 2019年8月. |
資料番号 |
SP2019-16 |
発行日 |
2019-08-21 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2019-16 |