講演抄録/キーワード |
講演名 |
2009-01-30 14:40
確率的線形回帰混合モデルを用いた音声変換 ○喬 宇・齋藤大輔・峯松信明(東大) SP2008-139 |
抄録 |
(和) |
本論文では二つの特徴空間の写像を学習する確率的線形回帰混合モデル(MPLR)を提案する。MPLR は複数の確率的線形回帰モデルを重み付きで混合することで構成されており、そのパラメータは行列計算によって推定可能である。MPLR は混合モデルであるため、非線形写像を取り扱う事ができる。またMPLR は一般化された定式化であるため、確率密度として特定のモデルを要求しない。よく知られているGMM を用いた音声変換法[1], [2] はMPLR の特別な場合と解釈でき、MPLR による一般化によって、GMM に基づく音声変換法を改良することが可能となる。[1] に対しては、MPLR の定式化を用いることで、複雑な一次方程式の解探索を避け、より高速なパラメータ推定が可能になる。更にMPLR は[2] に存在する暗黙の問題を解決する事ができる。我々は音声変換タスクで提案手法と従来のGMM 法について評価実験を行った。様々なパラメータ設定において実験を行った結果、MPLR 法は従来法に対してより良い性能を示した。 |
(英) |
This paper introduces a model of Mixture of Probabilistic Linear Regressions (MPLR) to learn a mapping function between two feature spaces. The MPLR consists of weighted combination of several probabilistic linear regressions, whose parameters are estimated by using matrix calculation. The mixture nature of MPLR allows it to model nonlinear transformation. The formulation of MPLR is general and independent of the types of the density models used. Two well-known GMM-based mapping methods for voice conversion [1], [2] can be regarded as the special cases of MPLR. This unifed view not only provides insights to the GMM-based mapping techniques, but also indicates methods to improve them. Compared to [1], our formulation of MPLR avoids solving complex linear equations and yields a faster estimation of the transform parameters. As for [2], the MPLR estimation provides a modifed mapping function which overcomes an implicit problem in [2]'s mapping function. We carried out experiments to compare the MPLR-based methods with the traditional GMM-based methods [1], [2] on a voice conversion task. The experimental results show that the MPLR-based methods always have better performance in various parameter setups. |
キーワード |
(和) |
空間写像 / 非線形写像 / 混合モデル / 線形回帰 / 音声変換 / / / |
(英) |
Space mapping / non-linear transform / mixture model / linear regression / voice conversion / / / |
文献情報 |
信学技報, vol. 108, no. 422, SP2008-139, pp. 79-84, 2009年1月. |
資料番号 |
SP2008-139 |
発行日 |
2009-01-22 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2008-139 |