講演抄録/キーワード |
講演名 |
2010-06-17 13:30
生成過程モデルを用いたHMMに基づく基本周波数パターン生成 ○松田徹也・広瀬啓吉・峯松信明(東大) SP2010-34 |
抄録 |
(和) |
HMM音声合成には, 分節的特徴と韻律的特徴の対応付けが自動的に行われるという特徴があり, これによって音声合成の柔軟な制御が可能となる. 一方で, 二つの特徴の対応付けはフレーム単位で行われるため, 分節よりも広い時間区間にまたがる韻律的特徴のモデル化は困難な問題となる. 特に学習データの量が十分でないとき, この問題は顕著となり, 誤った$F_0$パターン生成の原因となる. $F_0$パターンを表現する効果的な方法として, $F_0$パターン生成過程モデル($F_0$モデル)が挙げられる. $F_0モデル$は, 生理学的知見に基づいた数理モデルであり, $F_0$パターンを, 対数周波数軸上で, フレーズ成分とアクセント成分の重ね合わせとして表現する. このように記述することで, 広い時間区間にまたがる韻律的特徴であっても, 十分なモデル化が可能となる. 上述の観点に基づき, 本研究では, $F_0$モデルをHMM音声合成の制約条件として利用することを提案する. このとき, $F_0$モデルのパラメータは解析的に求めることができないため, 提案手法は, 従来手法によって生成された$F_0$パターンから$F_0$モデルの初期パラメータ値を抽出する処理と, HMM音声合成の枠組みを利用したパラメータ値の最適化処理の二つから構成される. また, 合成音声の主観評価実験を通して, 提案手法の有効性を評価する. |
(英) |
A method was proposed to increase naturalness of prosody generated by the speech synthesis based on the hidden Markov models (HMMs). It adds a constraint to the fundamental frequency contours ($F_0$ contours) during the HMM-based speech synthesis. The generation process model of $F_0$ contours ($F_0$ model) is adopted as the constraint. The $F_0$ model is based on the physiological mechanism of our phonation, and describes an $F_0$ contour in logarithmic scale as a superposition of phrase and accent components. The phrase component approximates global phenomena such as phrasing caused by an instantaneous activity of {\it pars obliqua} of the cricothyroid muscle. While the accent component approximates local phenomena such as word accent caused by a sudden increase or decrease in the activity of {\it pars recta} of the cricothyroid muscle. The proposed method first extracts the $F_0$ model parameters from the original $F_0$ contour (generated by the HMM-based speech synthesis) and then optimizes them successively by referring to HMMs already arranged. The experimental results show that the proposed method can increase naturalness when the $F_0$ control by the original method is not appropriate. |
キーワード |
(和) |
HMM音声合成 / 生成過程モデル / F0パターン / / / / / |
(英) |
HMM-based speech synthesis / generation process model / F0 contour / / / / / |
文献情報 |
信学技報, vol. 110, no. 81, SP2010-34, pp. 73-78, 2010年6月. |
資料番号 |
SP2010-34 |
発行日 |
2010-06-10 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2010-34 |
研究会情報 |
研究会 |
SP |
開催期間 |
2010-06-17 - 2010-06-18 |
開催地(和) |
九州大学筑紫キャンパス 共通管理棟3階 大会議室 |
開催地(英) |
Kyushu University |
テーマ(和) |
音声・言語・音響教育,一般 |
テーマ(英) |
Speech/Language/Acoustic Education, etc. |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2010-06-SP |
本文の言語 |
日本語 |
タイトル(和) |
生成過程モデルを用いたHMMに基づく基本周波数パターン生成 |
サブタイトル(和) |
|
タイトル(英) |
HMM-based F0 Contour Synthesis using the Generation Process Model |
サブタイトル(英) |
|
キーワード(1)(和/英) |
HMM音声合成 / HMM-based speech synthesis |
キーワード(2)(和/英) |
生成過程モデル / generation process model |
キーワード(3)(和/英) |
F0パターン / F0 contour |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
松田 徹也 / Tetsuya Matsuda / マツダ テツヤ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第2著者 氏名(和/英/ヨミ) |
広瀬 啓吉 / Keikichi Hirose / ヒロセ ケイキチ |
第2著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第3著者 氏名(和/英/ヨミ) |
峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ |
第3著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-06-17 13:30:00 |
発表時間 |
30分 |
申込先研究会 |
SP |
資料番号 |
SP2010-34 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.81 |
ページ範囲 |
pp.73-78 |
ページ数 |
6 |
発行日 |
2010-06-10 (SP) |
|