講演抄録/キーワード |
講演名 |
2014-12-16 11:00
HMMを用いた日本人英語音声合成における話者性を保持した韻律補正 ○大島悠司・高道慎之介・戸田智基・Graham Neubig・Sakriani Sakti・中村 哲(奈良先端大) SP2014-112 |
抄録 |
(和) |
日本語母語話者の話者性を反映した英語音声合成用音響モデルを構築するためには,日本人英語(ERJ:English Read by Japanese)に含まれる話者性を最大限に活用する枠組みが有効であると考えられる.しかしながら,日本人英語の利用により,言語体系の違いに起因する日英間の韻律の相違や発音誤りの影響を強く受けるため,自然
性が大きく劣化するという問題が生じる.これに対し本報告では,主に韻律の相違に着目し,英語母語話者の韻律を用いて日本人英語音声の韻律を補正することで,日本語母語話者の話者性を保持したまま,より自然な英語音声を合成する手法を提案する.HMM 音声合成におけるモデル適応法を応用することで,英語母語話者の継続長とパワーの特徴を,日本人英語の合成音声に反映させる.実験的評価結果から,提案法により,日本語母語話者の話者性を保持しつつ,より自然性の高い英語音声を合成できることを示す. |
(英) |
To build an English acoustic model that well captures speaker individuality of each Japanese speaker, a framework using English-Read-by-Japanese (ERJ) voices is effective as it enables to directly model speaker-dependent acoustic characteristics. However, naturalness of English speech synthesized by such an ERJ acoustic model is significantly degraded as it is directly affected by prosodic differences and pronunciation errors often caused by differences of a language system between Japanese and English. To synthesize more natural English speech while preserving speaker individuality of individual Japanese speakers, we propose a technique to correct prosody of ERJ voices based on that of a native English speaker. The duration and power of the native English speaker are effectively used to develop the ERJ acoustic model for each Japanese speaker by using model adaptation techniques in HMM-based speech synthesis. The experimental results show that our proposed method is capable of significantly improving naturalness of ERJ synthetic speech while preserving its speaker individuality. |
キーワード |
(和) |
日本人英語 / HMM音声合成 / 韻律補正 / 話者性 / モデル適応 / / / |
(英) |
English-Read-by-Japanese (ERJ) / HMM-based speech synthesis / prosody correction / speaker individuality / model adaptation / / / |
文献情報 |
信学技報, vol. 114, no. 365, SP2014-112, pp. 63-68, 2014年12月. |
資料番号 |
SP2014-112 |
発行日 |
2014-12-08 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-112 |