講演抄録/キーワード |
講演名 |
2012-11-08 11:30
同一文発話間における話者内スペクトル特徴量変動とその予測 ○犬飼辰夫・戸田智基・グラム ニュービッグ・サクリアニ サクティ・中村 哲(奈良先端大) SP2012-74 |
抄録 |
(和) |
統計的声質変換技術におけるスペクトルパラメータ変換処理おいて,その評価指標や変換モデルの学習指標として,しばしば変換パラメータと目標パラメータ間の距離尺度(例えばメルケプストラムひずみ)が用いられる.しかしながら,同一話者が同一文を発話した際においても,スペクトルパラメータは変動するため,スペクトルパラメータ間の距離は零とはならない.また,特にリアルタイム変換処理においては,複雑な変換処理を韻律パラメータに対して施すことは困難であるため,しばしば入力音声の韻律特徴を保持した変換音声が生成される.同一話者が同一文を異なる韻律特徴で発話した音声を生成することが目標となるが,この際に許容される発話間のスペクトルパラメータ間の距離についても考慮されていない.本報告では,スペクトルパラメータとしてメルケプストラムに着目し,同一話者が同一文を発話したときに生じるその変動量について調査する.また,発話間の韻律特徴の違いから,メルケプストラムの変動量を予測する手法を提案し,実験的評価結果から,その有効性を示す. |
(英) |
In spectral conversion of statistical voice conversion technologies, distance measures between the converted and target parameters, such as mel-cepstral distortion, are often used as evaluation/training metrics. However, even if the same speaker utters the same sentence, the spectral parameters of those utterances vary, and therefore, a distance between them still exists. Moreover, in real-time conversion procedure, converted speech keeping original prosodic features of input speech is often generated due to an essential difficulty of complex conversion of those features in real time. In such a case, an ideal sample of converted speech will be a speech sample uttered by a target speaker imitating prosody of the input speech but a spectral variation caused by such a prosodic change is not considered in the current evaluation/training metrics. In this report, we investigate an intra-speaker spectral variation between utterances of the same sentence focusing on mel-cepstrum as a spectral parameter. Moreover, we propose a method for predicting it from prosodic parameter differences between those utterances and conduct experimental evaluations to show its effectiveness. |
キーワード |
(和) |
声質変換 / 学習・評価指標 / スペクトル変動 / 同一文発話 / 韻律変動 / / / |
(英) |
voice conversion / training/evaluation metric / spectral variation / utterances of the same sentence / prosodic variation / / / |
文献情報 |
信学技報, vol. 112, no. 281, SP2012-74, pp. 13-18, 2012年11月. |
資料番号 |
SP2012-74 |
発行日 |
2012-11-01 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2012-74 |
|