お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-12-06 16:25
発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価
岡田慎太郎名大)・安藤厚志名大/NTT)・戸田智基名大SP2019-43
抄録 (和) 本稿では,発話感情認識の精度向上に向けて,表現学習およびデータ拡張に基づく感情認識特徴量抽出法を提案する.
表現学習に基づく従来法では,大量の感情ラベル無し音声を用いた教師なし学習により,音声特徴量を再構成する潜在特徴を抽出した後に,少量の感情ラベル付き音声を用いて感情分類モデルの学習を行う.
少量の感情ラベル付き音声で学習する場合と比較し,未知な音声に対してより頑健なモデルが構築できると期待されるが,潜在特徴には音声の感情因子のみでなく音韻因子や話者因子なども混入すると考えられるため,感情認識に特化した潜在特徴が得られない可能性がある.
この課題を解決するため,本稿では,潜在特徴から音韻因子と話者因子の影響を低減する手法を提案する.
提案手法では,補助情報として音韻情報を捉える音素事後確率系列を与える表現学習を行い,音韻因子の影響を極力取り除いた潜在特徴を獲得する.
さらに,教師あり学習で用いる感情ラベル付き音声に対して,疑似的に話者性を変換する音声変換処理を適用してデータ拡張を行い,話者因子の影響を低減するための手がかりを増強する.
実験的評価の結果から,音韻因子の影響を低減する表現学習法は,従来手法に比べて正解精度が向上することを示す. 
(英) This paper presents a new speech emotion recognition method based on representation learning and data augmentation.
To improve the robustness against unseen speech, the conventional representation learning-based emotion recognition method utilizes a latent variable extracted by an unsupervisedly-learned speech reconstruction model to train an emotion recognizer using a limited amount of supervised data.
However, the latent variable is expected to include not only an informative factor for emotion recognition but also less informative factors, such as phonetic and speaker information.
The proposed method alleviates the effects of these less informative factors on the latent variable.
To reduce the effects of a phonetic factor, phonetic posteriorgram (PPG) is provided as an auxiliary input of the reconstruction model in representation learning.
Moreover, the effects of a speaker factor is mitigated by data augmentation to generate utterances with various speaker characteristics by using a speech morphing technique.
Experimental results show that the proposed representation learning method using PPG outperforms the conventional method.
キーワード (和) 発話感情認識 / 表現学習 / 自己符号化器 / 音素事後確率 / データ拡張 / / /  
(英) speech emotion recognition / representation learning / autoencoder / phoneme posteriorgrams / data augmentation / / /  
文献情報 信学技報, vol. 119, no. 321, SP2019-43, pp. 91-96, 2019年12月.
資料番号 SP2019-43 
発行日 2019-11-29 (SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.
PDFダウンロード SP2019-43

研究会情報
研究会 NLC IPSJ-NL SP IPSJ-SLP  
開催期間 2019-12-04 - 2019-12-06 
開催地(和) NHK放送技術研究所 
開催地(英) NHK Science & Technology Research Labs. 
テーマ(和) 第6回自然言語処理シンポジウム & 第21回音声言語シンポジウム 
テーマ(英) The 6th Natural Language Processing Symposium & The 21th Spoken Language Symposium 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2019-12-NLC-NL-SP-SLP 
本文の言語 日本語 
タイトル(和) 発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価 
サブタイトル(和)  
タイトル(英) An evaluation of representation learning using phoneme posteriorgrams and data augmentation in speech emotion recognition 
サブタイトル(英)  
キーワード(1)(和/英) 発話感情認識 / speech emotion recognition  
キーワード(2)(和/英) 表現学習 / representation learning  
キーワード(3)(和/英) 自己符号化器 / autoencoder  
キーワード(4)(和/英) 音素事後確率 / phoneme posteriorgrams  
キーワード(5)(和/英) データ拡張 / data augmentation  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 岡田 慎太郎 / Shintaro Okada / オカダ シンタロウ
第1著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第2著者 氏名(和/英/ヨミ) 安藤 厚志 / Atsushi Ando / アンドウ アツシ
第2著者 所属(和/英) 名古屋大学/NTT (略称: 名大/NTT)
Nagoya University/NTT (略称: Nagoya Univ./NTT)
第3著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第3著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2019-12-06 16:25:00 
発表時間 25分 
申込先研究会 SP 
資料番号 SP2019-43 
巻番号(vol) vol.119 
号番号(no) no.321 
ページ範囲 pp.91-96 
ページ数
発行日 2019-11-29 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会