お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2009-01-30 14:40
確率的線形回帰混合モデルを用いた音声変換
喬 宇齋藤大輔峯松信明東大SP2008-139
抄録 (和) 本論文では二つの特徴空間の写像を学習する確率的線形回帰混合モデル(MPLR)を提案する。MPLR は複数の確率的線形回帰モデルを重み付きで混合することで構成されており、そのパラメータは行列計算によって推定可能である。MPLR は混合モデルであるため、非線形写像を取り扱う事ができる。またMPLR は一般化された定式化であるため、確率密度として特定のモデルを要求しない。よく知られているGMM を用いた音声変換法[1], [2] はMPLR の特別な場合と解釈でき、MPLR による一般化によって、GMM に基づく音声変換法を改良することが可能となる。[1] に対しては、MPLR の定式化を用いることで、複雑な一次方程式の解探索を避け、より高速なパラメータ推定が可能になる。更にMPLR は[2] に存在する暗黙の問題を解決する事ができる。我々は音声変換タスクで提案手法と従来のGMM 法について評価実験を行った。様々なパラメータ設定において実験を行った結果、MPLR 法は従来法に対してより良い性能を示した。 
(英) This paper introduces a model of Mixture of Probabilistic Linear Regressions (MPLR) to learn a mapping function between two feature spaces. The MPLR consists of weighted combination of several probabilistic linear regressions, whose parameters are estimated by using matrix calculation. The mixture nature of MPLR allows it to model nonlinear transformation. The formulation of MPLR is general and independent of the types of the density models used. Two well-known GMM-based mapping methods for voice conversion [1], [2] can be regarded as the special cases of MPLR. This unifed view not only provides insights to the GMM-based mapping techniques, but also indicates methods to improve them. Compared to [1], our formulation of MPLR avoids solving complex linear equations and yields a faster estimation of the transform parameters. As for [2], the MPLR estimation provides a modifed mapping function which overcomes an implicit problem in [2]'s mapping function. We carried out experiments to compare the MPLR-based methods with the traditional GMM-based methods [1], [2] on a voice conversion task. The experimental results show that the MPLR-based methods always have better performance in various parameter setups.
キーワード (和) 空間写像 / 非線形写像 / 混合モデル / 線形回帰 / 音声変換 / / /  
(英) Space mapping / non-linear transform / mixture model / linear regression / voice conversion / / /  
文献情報 信学技報, vol. 108, no. 422, SP2008-139, pp. 79-84, 2009年1月.
資料番号 SP2008-139 
発行日 2009-01-22 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2008-139

研究会情報
研究会 SP  
開催期間 2009-01-29 - 2009-01-30 
開催地(和) 奈良先端大 
開催地(英) NAIST 
テーマ(和) 一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2009-01-SP 
本文の言語 日本語 
タイトル(和) 確率的線形回帰混合モデルを用いた音声変換 
サブタイトル(和)  
タイトル(英) Mixture of Probabilistic Linear Regression for Voice Conversion 
サブタイトル(英)  
キーワード(1)(和/英) 空間写像 / Space mapping  
キーワード(2)(和/英) 非線形写像 / non-linear transform  
キーワード(3)(和/英) 混合モデル / mixture model  
キーワード(4)(和/英) 線形回帰 / linear regression  
キーワード(5)(和/英) 音声変換 / voice conversion  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 喬 宇 / Yu Qiao / チャオ ユイ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第2著者 氏名(和/英/ヨミ) 齋藤 大輔 / Daisuke Saito / サイトウ ダイスケ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第3著者 氏名(和/英/ヨミ) 峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2009-01-30 14:40:00 
発表時間 25分 
申込先研究会 SP 
資料番号 SP2008-139 
巻番号(vol) vol.108 
号番号(no) no.422 
ページ範囲 pp.79-84 
ページ数
発行日 2009-01-22 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会