HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成

高道,慎之介; 戸田,智基; 志賀,芳則; Sakriani,Sakti; Graham,Neubig; 中村,哲

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2013-01-30 16:45 HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成 ○高道慎之介・戸田智基（奈良先端大）・志賀芳則（NICT）・Sakriani Sakti・Graham Neubig・中村　哲（奈良先端大） SP2012-104
抄録	（和）	隠れマルコフモデル(Hidden Markov Model：HMM) に基づく音声合成において，生成される音声パラメータは過剰に平滑化される傾向にあり，合成音声の肉声感は劣化する．これに対して我々は，HMM 音声合成の利点を保持したハイブリッド法として，分散共有フルコンテキストモデルによるパラメータ生成法を提案しており，スペクトルパラメータにおいてその有効性を示している．本稿では，より音質の高い合成音声を得るために，分散共有フルコンテキストモデルによるF0パターン生成法を提案する．F0のモデル化に広く用いられる多空間確率分布HMM （Multi-Space probability Distribution HMM：MSD-HMM）を用いて分散共有フルコンテキストモデルを構築し，F0パターンを生成する．実験的評価結果から，提案法により合成音声の音質が向上することを示す．
	（英）	In the traditional HMM-based speech synthesis, generated speech parameters tend to be excessively over-smoothed. To alleviate this problem, we have proposed a spectral parameter generation method with rich context models and have showed its effectiveness. In this paper, we propose a F0 contour generation method with the rich context models, which are successfully applied to Multi-Space probability Distribution HMM (MSD-HMM) for modeling F0 contour. Experimental evaluations demonstrate that the proposed method yields signiﬁcant improvements in the quality of synthetic speech.
キーワード	（和）	F0パターン生成 / MSD-HMM / 分散共有フルコンテキストモデル / パラメータ生成法 / / / /
	（英）	F0 contour generation / MSD-HMM / rich context models / parameter generation method / / / /
文献情報		信学技報, vol. 112, no. 422, SP2012-104, pp. 37-42, 2013年1月.
資料番号		SP2012-104
発行日		2013-01-23 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		SP2012-104

研究会情報
研究会	SP
開催期間	2013-01-30 - 2013-01-31
開催地（和）	同志社大学
開催地（英）	Doshisha Univ.
テーマ（和）	音声・言語・対話，一般
テーマ（英）	Speech, Language, and Dialogue, etc.
講演論文情報の詳細
申込み研究会	SP
会議コード	2013-01-SP
本文の言語	日本語
タイトル（和）	HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成
サブタイトル（和）
タイトル（英）	F0 contour generation using rich context models in HMM-based speech synthesis
サブタイトル（英）
キーワード(1)（和/英）	F0パターン生成 / F0 contour generation
キーワード(2)（和/英）	MSD-HMM / MSD-HMM
キーワード(3)（和/英）	分散共有フルコンテキストモデル / rich context models
キーワード(4)（和/英）	パラメータ生成法 / parameter generation method
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	高道慎之介 / Shinnosuke Takamichi / タカミチシンノスケ
第1著者所属（和/英）	奈良先端科学技術大学院大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： NAIST)
第2著者氏名（和/英/ヨミ）	戸田智基 / Tomoki Toda / トダトモキ
第2著者所属（和/英）	奈良先端科学技術大学院大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： NAIST)
第3著者氏名（和/英/ヨミ）	志賀芳則 / Yoshinori Shiga / シガヨシノリ
第3著者所属（和/英）	情報通信研究機構 (略称： NICT) National Institute of Information and Communications Technology (略称： NICT)
第4著者氏名（和/英/ヨミ）	Sakriani Sakti / Sakriani Sakti / サクリアニサクテイ
第4著者所属（和/英）	奈良先端科学技術大学院大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： NAIST)
第5著者氏名（和/英/ヨミ）	Graham Neubig / Graham Neubig / グラムニュービッグ
第5著者所属（和/英）	奈良先端科学技術大学院大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： NAIST)
第6著者氏名（和/英/ヨミ）	中村哲 / Satoshi Nakamura / ナカムラサトシ
第6著者所属（和/英）	奈良先端科学技術大学院大学 (略称：奈良先端大) Nara Institute of Science and Technology (略称： NAIST)
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2013-01-30 16:45:00
発表時間	30分
申込先研究会	SP
資料番号	SP2012-104
巻番号（vol）	vol.112
号番号（no）	no.422
ページ範囲	pp.37-42
ページ数	6
発行日	2013-01-23 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会