講演抄録/キーワード |
講演名 |
2008-12-10 16:10
HMM音声合成における共分散パラメータの共有に関する検討 ○大浦圭一郎・全 炳河・南角吉彦・李 晃伸・徳田恵一(名工大) NLC2008-60 SP2008-115 |
抄録 |
(和) |
本報告では隠れマルコフモデル(Hidden Markov Model; HMM) に基づく音声合成システムにおける共分
散パラメータの共有について述べる.近年,音声合成システムへの需要が高まっており,HMM に基づいた音声合成
システムでは音声波形の断片をそのまま利用するのではなく,音声波形の特徴をHMM によりモデル化し,HMM の
モデルパラメータを合成システムに保持するため,同程度の音質の波形接続法式に比べてフットプリントが小さい利
点がある.中でも組み込み向けのシステムには携帯電話,PDA,カーナビ,情報家電,ゲーム機等への用途があるが,
必要なCPU,メモリ等が制限されることが多く,更なるフットプリントの縮小が必要である.HMM に基づく音声合
成システムにコンテキスト依存モデルを用いることで高精度な音響モデルを構築することができ,決定木に基づくコ
ンテキストクラスタリングを用いて状態共有構造を構築する際に,組み込み用途向けに決定木のサイズを小さくする
ことも考えられるが,音質が劣化する.本報告では,平均に比べて共分散が音質に与える影響が小さいことに注目し,
全てのパラメータの共分散を共有する手法を提案する.このパラメータ共有を仮定した上でのコンテキストクラスタ
リングを行い,主観評価実験により,パラメータ数を大幅に削減するのみならず,若干の品質改善を達成した. |
(英) |
In this paper, we proposed a tying covariance technique in hidden Markov model (HMM) basedspeech
synthesis system. In recent years, context-dependent model are used for training high quality model in hidden
Markov model (HMM) based speech synthesis system. However, the use of context-dependent models results in too
many free-parameters in a system, hence it is di±cult to estimate the model which is statistically reliable. This is
a fatal problem for development of embedded devices (mobile phone, PDA, etc...) especially. Therefore, variaous
parameter clustering techniques have been proposed. The use of desicion tree based context-clustering approach is a
good solution to this problem. The splitting procedure of the decision tree provides a way of keeping the balance of
model complexity and robustness. Furthermore, by incorporating phonetic knowledge into questions, it can assign
unseen context-dependent models to the leaf node of decision trees. In this paper, a new approach is proposed by
tying all covariances. In subjective experimental results, proposed technique archived higher MOS score and smaller
number of parameters than conditional technique. |
キーワード |
(和) |
隠れマルコフモデル / 音声合成 / 決定木 / コンテキストクラスタリング / MDL基準 / 組み込み機器 / / |
(英) |
Hidden Markov Model / Speech Synthesis / Decision Tree / Context-Clustering / MDL Criterion / Embedded Device / / |
文献情報 |
信学技報, vol. 108, no. 338, SP2008-115, pp. 215-220, 2008年12月. |
資料番号 |
SP2008-115 |
発行日 |
2008-12-02 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2008-60 SP2008-115 |
|