時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換

油谷,かおり; 南角,吉彦; 戸田,智基; 徳田,恵一

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2008-12-10 10:20 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換 ○油谷かおり・南角吉彦（名工大）・戸田智基（奈良先端大）・徳田恵一（名工大） NLC2008-37 SP2008-92
抄録	（和）	本稿では時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換手法を提案する．これまで声質変換の主な手法としては，ガウス混合モデル(GMM) に基づくスペクトル変換法が用いられてきた．この手法では，元話者・目標話者間のフレームの対応を一対一と仮定しているため，発話速度を考慮したスペクトル変換を行うことができない．しかし，話者性は発話速度にも表れると考えられる．そこで本研究では継続長変換を行うため，時系列マッチングを含む統計モデル(DPGMM) を適用する．DPGMM は長さの異なる2 つの系列を直接表現するため，継続長およびスペクトルの同時変換が可能となる．提案法では，DPGMMの各混合要素に継続長モデルを付加し，非線形かつスペクトル情報に依存した継続長変換を行う．
	（英）	This paper describes a simultaneous conversion technique of duration and spectrum based on a statistical model including time-sequence matching. The conventional GMM-based approach cannot perform spectral conversion taking account of speaking rates because it assumes one to one frame matching between source and target features. However, speaker characteristics may also appear in speaking rates. In order to perform duration conversion, we attach duration models to statistical models including time-sequence matching (DPGMM). Since DPGMM can represent two different length sequences directly, the conversion of spectrum and duration can be performed within an integrated framework. In the proposed technique, each mixture component of DPGMM has different duration transformation functions, therefore durations are converted nonlinearly and dependently on spectral information. In a subjective DMOS test, the proposed method is superior to the conventional method.
キーワード	（和）	声質変換 / GMM / 継続長変換 / / / / /
	（英）	Voice conversion / GMM / Duration conversion / / / / /
文献情報		信学技報, vol. 108, no. 338, SP2008-92, pp. 79-84, 2008年12月.
資料番号		SP2008-92
発行日		2008-12-02 (NLC, SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NLC2008-37 SP2008-92

研究会情報
研究会	SP NLC
開催期間	2008-12-09 - 2008-12-10
開催地（和）	早稲田大学（小野記念講堂）
開催地（英）	Waseda Univ.
テーマ（和）	第10回音声言語シンポジウム（SP/NLC/SLP共催）
テーマ（英）
講演論文情報の詳細
申込み研究会	SP
会議コード	2008-12-SP-NLC
本文の言語	英語（日本語タイトルあり）
タイトル（和）	時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換
サブタイトル（和）
タイトル（英）	Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching
サブタイトル（英）
キーワード(1)（和/英）	声質変換 / Voice conversion
キーワード(2)（和/英）	GMM / GMM
キーワード(3)（和/英）	継続長変換 / Duration conversion
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	油谷かおり / Kaori Yutani / ユタニカオリ
第1著者所属（和/英）	名古屋工業大学 (略称：名工大) Nagoya Institute of Technology (略称： Nagoya Institute of Technology)
第2著者氏名（和/英/ヨミ）	南角吉彦 / Yoshihiko Nankaku / ナンカクヨシヒコ
第2著者所属（和/英）	名古屋工業大学 (略称：名工大) Nagoya Institute of Technology (略称： Nagoya Institute of Technology)
第3著者氏名（和/英/ヨミ）	戸田智基 / Tomoki Toda / トダトモキ
第3著者所属（和/英）	奈良先端科学技術大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： Nara Institute of Science and Technology)
第4著者氏名（和/英/ヨミ）	徳田恵一 / Keiichi Tokuda / トクダケイイチ
第4著者所属（和/英）	名古屋工業大学 (略称：名工大) Nagoya Institute of Technology (略称： Nagoya Institute of Technology)
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2008-12-10 10:20:00
発表時間	25分
申込先研究会	SP
資料番号	NLC2008-37, SP2008-92
巻番号（vol）	vol.108
号番号（no）	no.337(NLC), no.338(SP)
ページ範囲	pp.79-84
ページ数	6
発行日	2008-12-02 (NLC, SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会