講演抄録/キーワード |
講演名 |
2007-05-31 11:00
HMMを用いた話し言葉音声合成のためのモデルの検討 赤川達也・○岩野公司・古井貞煕(東工大) SP2007-3 |
抄録 |
(和) |
本稿では,HMM 音声合成に基づく話し言葉音声合成システムの構築と,そこで用いられるモデルの有効性に関する分析結果について報告する.我々の合成システムでは,ケプストラム情報は HMM でモデル化され,音素継続時間長(音素長)と基本周波数(F0)情報は数量化I類でモデル化される.これら 3 つのモデルを,日本語話し言葉コーパスの学会講演音声を用いて学習し,話し言葉音声合成システムを構築した.このシステムの合成音声の「話し言葉らしさ」を評価するため,全てのモデルを読み上げ音声から学習して構築したシステムの合成音声との対比較実験を行ったところ,話し言葉音声を用いて構築したシステムの方が高い評価を得ることが確認された.これにより,実際の話し言葉音声を用いて HMM 音声合成に基づく音声合成システムを構築することが,話し言葉らしい音声の合成に有効であることが示された.また,用いた 3 つのモデルについて,それぞれがどの程度,合成音声の話し言葉らしさ影響を与えているかに関する種々の分析を,被験者による聴取実験によって行った. |
(英) |
This paper describes construction of an HMM-based spontaneous speech
synthesizer and investigates effectiveness of the statistical models
in the system. In our system, cepstral features are modeled by HMMs and phoneme duration and fundamental frequency (F0) features are modeled by Quantification Theory (Type 1). These three models are trained with spontaneous lecture speech extracted from the Corpus of Spontaneous Japanese (CSJ). For comparison, we prepared a speech synthesizer where all models were trained with read speech. Spontaneity of the synthesized spontaneous speech was evaluated by subjective pair comparison tests. Experimental results show that the preference score for the synthesized spontaneous speech is significantly higher than that for the synthesized read speech. This implies that HMM-based speech synthesis using actual spontaneous utterances for model training is effective for producing spontaneous speech. Additional subjective evaluations were also conducted to analyze the effect of individual models used in our synthesizer on the impression of spontaneity. |
キーワード |
(和) |
話し言葉音声合成 / HMM音声合成 / 日本語話し言葉コーパス / 数量化I類 / / / / |
(英) |
Spontaneous speech synthesis / HMM-based speech synthesis / Corpus of Spontaneous Japanese / Quantification Theory (Type 1) / / / / |
文献情報 |
信学技報, vol. 107, no. 77, SP2007-3, pp. 13-18, 2007年5月. |
資料番号 |
SP2007-3 |
発行日 |
2007-05-24 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2007-3 |