講演抄録/キーワード |
講演名 |
2013-01-30 16:45
HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成 ○高道慎之介・戸田智基(奈良先端大)・志賀芳則(NICT)・Sakriani Sakti・Graham Neubig・中村 哲(奈良先端大) SP2012-104 |
抄録 |
(和) |
隠れマルコフモデル(Hidden Markov Model:HMM) に基づく音声合成において,生成される音声パラメータは過剰に平滑化される傾向にあり,合成音声の肉声感は劣化する.これに対して我々は,HMM 音声合成の利点を保持したハイブリッド法として,分散共有フルコンテキストモデルによるパラメータ生成法を提案しており,スペクトルパラメータにおいてその有効性を示している.本稿では,より音質の高い合成音声を得るために,分散共有フルコンテキストモデルによるF0パターン生成法を提案する.F0のモデル化に広く用いられる多空間確率分布HMM (Multi-Space probability Distribution HMM:MSD-HMM)を用いて分散共有フルコンテキストモデルを構築し,F0パターンを生成する.実験的評価結果から,提案法により合成音声の音質が向上することを示す. |
(英) |
In the traditional HMM-based speech synthesis, generated speech parameters tend to be excessively over-smoothed. To alleviate this problem, we have proposed a spectral parameter generation method with rich context models and have showed its effectiveness. In this paper, we propose a F0 contour generation method with the rich context models, which are successfully applied to Multi-Space probability Distribution HMM (MSD-HMM) for modeling F0 contour. Experimental evaluations demonstrate that the proposed method yields significant improvements in the quality of synthetic speech. |
キーワード |
(和) |
F0パターン生成 / MSD-HMM / 分散共有フルコンテキストモデル / パラメータ生成法 / / / / |
(英) |
F0 contour generation / MSD-HMM / rich context models / parameter generation method / / / / |
文献情報 |
信学技報, vol. 112, no. 422, SP2012-104, pp. 37-42, 2013年1月. |
資料番号 |
SP2012-104 |
発行日 |
2013-01-23 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2012-104 |