講演抄録/キーワード |
講演名 |
2013-12-20 10:10
言語モデルと音響モデルを利用したアクセント句境界の自動推定 ○鈴木啓史・郡山智樹(東工大)・能勢 隆(東北大)・篠崎隆宏・小林隆夫(東工大) SP2013-89 |
抄録 |
(和) |
テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが,アクセント情報の付与は主に人手で行われており高コストである.そこで本研究では,音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する.提案手法では,音声を書き起こしたテキスト情報だけでなく,音声から得られるF0などの音響特徴量を使用する.アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場(CRF)を,そして音響モデルに隠れマルコフモデル(HMM)を使用し,それらを組み合わせてアクセント句の境界を推定する.本稿では,読み上げ音声に対するアクセント句境界推定実験を行い,従来法に比べ推定精度が向上することを示した. |
(英) |
This paper proposes a technique for automatically estimating accent phrase boundaries for text-to-speech synthesis systems. To construct speech synthesis systems, we need to prepare a database that has annotations of prosodic information including accents. However, manual annotation for this purpose generally requires costly process. In contrast, the proposed method utilizes conditional random field (CRF) for the language models of accent phrase boundary and accent type, and uses hidden markov model (HMM) for the acoustic feature model. In this paper, we confirmed that the proposed method improved the estimation accuracy for reading-style speech data compared with conventional method. |
キーワード |
(和) |
アクセント句境界 / 韻律 / HMM / CRF / / / / |
(英) |
accent phrase boundary / prodosy / HMM / CRF / / / / |
文献情報 |
信学技報, vol. 113, no. 366, SP2013-89, pp. 97-102, 2013年12月. |
資料番号 |
SP2013-89 |
発行日 |
2013-12-12 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-89 |