講演抄録/キーワード |
講演名 |
2018-01-20 14:55
[ポスター講演]深層学習による調音-音声変換に関する検討 ○田口史朗・鏑木時彦(九大) SP2017-70 |
抄録 |
(和) |
本研究では,磁気センサ(EMA)で観測された調音器官の運動パタンを音声の特徴量に変換する方法を検討した.調音パラメータは声道の音響特性と直接的な関係があることから,従来研究では調音器官の運動パタンから音声のスペクトル包絡を表す特徴量への変換が行われてきた.しかしながら,調音パラメータや声道の音響特性は音声の音韻性を担っており,さらにピッチパターンや有声無声などの音源情報は音韻情報と無関係ではないことを考えると,調音パラメータと音源情報の間にも何らかの関係性が存在する可能性が考えられる.本研究ではこの関係を利用して,スペクトル包絡だけでなく音源に関する特徴量を推定することで,調音器官の運動パタンから直接音声の合成を行い,推定した音声パラメータの客観評価を行った. |
(英) |
In this study, we examined a method to convert the movement pattern of articulatory organs observed by a magnetic sensor (EMA) into feature parameters of speech. In conventional studies, articulation parameters representing movement pattern of articulatory organs were usually converted to feature parameters representing the spectral envelope of the speech, because articulation parameters are directly related to the acoustic characteristics of the vocal tract. However, articulatory parameters and the acoustic characteristics of the vocal tract are responsible for the phonological properties of speech and phonemic information is related to glottal sound source information such as the pitch pattern and the voiced-unvoiced distinction. These considerations suggest that there exists a certain kind of relationship between articulatory parameters and the glottal sound source information. In this study, we relied on this relationship and estimated not only the spectral envelope but also features related to the glottal sound source, thereby synthesizing speech directly from the movement orbit of articulatory organs. We also objectively evaluated the estimation accuracy of speech parameters. |
キーワード |
(和) |
調音運動 / 声道スペクトル / Deep Learning / 調音-音響マッピング / / / / |
(英) |
articulatory movement / vocal tract spectrum / Deep Learning / articulatory-to-acoustic mapping / / / / |
文献情報 |
信学技報, vol. 117, no. 393, SP2017-70, pp. 27-30, 2018年1月. |
資料番号 |
SP2017-70 |
発行日 |
2018-01-13 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2017-70 |