F0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討

神山,歩相名; 篠崎,隆宏; 岩野,公司; 古井,貞煕

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2009-06-25 14:30 F0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討 ○神山歩相名・篠崎隆宏（東工大）・岩野公司（東京都市大）・古井貞煕（東工大） SP2009-38
抄録	（和）	本稿では，数量化I類による$F_0$パターン生成モデルの話者適応手法を提案する．本手法では，複数の話者による大量の音声を用いて，日本語（標準語）として自然な$F_0$パターンを学習し，少量の話者依存音声データを用いて，特定話者に合わせて平均値を置換することで，自然性が高くかつ個人に適応したモデルを作成する．この手法によって求めたモデルについて，客観評価実験を行ったところ，5文程度で話者適応が可能であることが確認できた．また，主観評価実験を行ったところ，450文で学習したモデルによる合成音と50文で適応したモデルの合成音に，ほぼ同程度の自然性が認められた．これより，適応手法が自然性に優れた話者適応法であることが確認された．
	（英）	This paper proposes a new speaker adaptation method for the fundamental frequency ($F_0$) contour generation models based on the Quantification Theory (Type I). In this method, natural $F_0$ contour producing models for standard Japanese are trained using a large amount of speech data from many speakers, and natural as well as speaker-specific $F_0$ contours are generated by adapting mean $F_0$ values using a small amount of speech data from a specific speaker. Objective evaluation results using the models made by the proposed method confirm that around five sentences are enough for speaker adaptation. Subjective evaluation results confirm that naturalness of the synthesized speech using models adapted by 50 sentences is almost equivalent to that of the synthesized speech using models trained by 450 sentences for a specific speaker. These results indicate that the proposed adaptation method can produce highly natural synthesized speech.
キーワード	（和）	HMM音声合成 / 数量化I類 / F0パターン / 韻律制御 / 話者適応 / / /
	（英）	HMM-based Speech Synthesis / Quantification Theory (Type I) / F0 Contour Generation / Prosody Control / Speaker Adaptation / / /
文献情報		信学技報, vol. 109, no. 99, SP2009-38, pp. 87-92, 2009年6月.
資料番号		SP2009-38
発行日		2009-06-17 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		SP2009-38

研究会情報
研究会	SP
開催期間	2009-06-24 - 2009-06-25
開催地（和）	北海道大学クラーク会館
開催地（英）	Clark Memorial Hall, Hokkaido Univ.
テーマ（和）	感情音声、韻律、声質、音声生成・知覚、脳機能、一般
テーマ（英）	emotional speech, prosody, voice quality, speech production and perception, brain activity, etc.
講演論文情報の詳細
申込み研究会	SP
会議コード	2009-06-SP
本文の言語	日本語
タイトル（和）	F0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討
サブタイトル（和）
タイトル（英）	A mean F0 speaker adaptation method for regression model-based F0 contour generation
サブタイトル（英）
キーワード(1)（和/英）	HMM音声合成 / HMM-based Speech Synthesis
キーワード(2)（和/英）	数量化I類 / Quantification Theory (Type I)
キーワード(3)（和/英）	F0パターン / F0 Contour Generation
キーワード(4)（和/英）	韻律制御 / Prosody Control
キーワード(5)（和/英）	話者適応 / Speaker Adaptation
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	神山歩相名 / Hosana Kamiyama / カミヤマホサナ
第1著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Inst. of Tech.)
第2著者氏名（和/英/ヨミ）	篠崎隆宏 / Takahiro Shinozaki / シノザキタカヒロ
第2著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Inst. of Tech.)
第3著者氏名（和/英/ヨミ）	岩野公司 / Koji Iwano / イワノコウジ
第3著者所属（和/英）	東京都市大学 (略称：東京都市大) Tokyo City University (略称： Tokyo City Univ.)
第4著者氏名（和/英/ヨミ）	古井貞煕 / Sadaoki Furui / フルイサダオキ
第4著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Inst. of Tech.)
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2009-06-25 14:30:00
発表時間	30分
申込先研究会	SP
資料番号	SP2009-38
巻番号（vol）	vol.109
号番号（no）	no.99
ページ範囲	pp.87-92
ページ数	6
発行日	2009-06-17 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会