講演抄録/キーワード |
講演名 |
2008-12-10 10:45
基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出につい ○河原英紀(和歌山大)・森勢将雅(関西学院大)・高橋 徹(京大)・坂野秀樹(名城大)・西村竜一・入野俊夫(和歌山大) NLC2008-38 SP2008-93 |
抄録 |
(和) |
高品質の音声分析変換合成のための非周期成分の抽出を検討している。本報告では,これまでにSTRAIGHTで用いてきたものを中心に、従来の方法とそれらの問題点を挙げ、新しい方法を提案する。提案する方法は、基本周期程度の時間間隔を隔てた部分からの前方および後方予測可能な成分を取り除いたものを非周期成分とし、時間-帯域幅積(TB積)を設定するためのQuadrature Mirror filterによる帯域分割と、基本周波数の瞬時周波数に基づく時間軸の伸縮を併用する。これらから得られる複数の手掛かりを統合することにより、従来の方法よりも効率が良くランダムな揺らぎの影響の少ない推定が可能となった。 |
(英) |
A reliable aperiodicity extractor is crucial for high-quality speech manipulation systems. This article proposes a new extractor based on a critical review on conventional methods (mainly on our previous proposals) and fundamental issues. The proposed method uses forward and backward linear predictors with lags around fundamental period and consists of an instantaneous fundamental frequency-based temporal axis warping. The extractor also consists of Quadrature Mirror Filter for frequency band division to control TB (time-bandwidth) product for reliable estimates. Combination of multiple clues extracted using the original and the manipulated time axes yields reliable and efficient estimates of aperiodicity spectrogram. |
キーワード |
(和) |
音声分析 / 音声合成 / 声質 / 予測残差 / 時間軸伸縮 / / / |
(英) |
speech analysis / speech synthesis / voice quality / prediction residuals / temporal axis warping / / / |
文献情報 |
信学技報, vol. 108, no. 338, SP2008-93, pp. 85-90, 2008年12月. |
資料番号 |
SP2008-93 |
発行日 |
2008-12-02 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2008-38 SP2008-93 |