講演抄録/キーワード |
講演名 |
2008-12-10 16:10
音声の高速再生のための話速推定法と高速発話時の特性解析 ~ 話速バリエーション型データベースの活用例 ~ ○吉原 亨・蔦木圭悟・高橋弘太(電通大) NLC2008-63 SP2008-118 |
抄録 |
(和) |
できるだけ聞き落としを生じることなく,時間的な効率を上げて音声再生を行うためには,個々の音声に対して最適な再生速度を決定するための指標が必要となる.本稿では,この問題に関して得られた2つの成果について発表する.
第一の成果は,2つの異なる狭帯域エネルギの時間変化に着目した話速推定法を提案し,正規化した誤差で16%の推定精度で話速推定が行えることを示したことである.第二の成果は,通常発話の音声と高速発話の音声を,それぞれ極めて速い話速に話速変換した結果を観察し,高速発話を話速変換した音声が,より調波構造の乱れが少ないことを示したことである.
本稿は,我々で製作している話速バリエーション型音声データベース(SRV-DB) を用いて行った.我々は本研究をSRV-DBの有効な利用法の一例として発表する. |
(英) |
A quantitative index is needed to estimate the optimum reproduction speed for high speed reproduction of various voices without missing voices. In this paper, we report two results concerning this problem.
As the first result, we propose a method for estimating speaking rate and show that we can estimate the speaking rate with 16 % of root mean squared error using proposed method.As the second result, we show that the higher conversion rate becomes, the larger the inconsistency of the harmonic structure of a voice become.
In this study, we have used a newly constructed speech data base called SRV-DB. We intend to announce this paper as a practical example of the SRV-DB. |
キーワード |
(和) |
話速推定 / 話速変換 / 音声データベース / / / / / |
(英) |
estimate speaking rate / speaking rate conversion / speech data base / / / / / |
文献情報 |
信学技報, vol. 108, no. 338, SP2008-118, pp. 233-238, 2008年12月. |
資料番号 |
SP2008-118 |
発行日 |
2008-12-02 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2008-63 SP2008-118 |