講演抄録/キーワード |
講演名 |
2022-06-18 15:00
F0適応ラグ窓を用いた音声分析系の精緻化 ○越森道貴・嵯峨山茂樹・岸田拓也・中鹿 亘(電通大) SP2022-21 |
抄録 |
(和) |
音声分析の手法として様々なものが研究されているが、その一つにラグ窓法というものがある。これはソース・フィルタモデルに基づいて、音声の自己相関関数上にラグ窓を掛けてスペクトルを平滑化することにより、音源情報とフィルタ情報を分離するといった手法である。しかしこの手法のラグ窓で用いられていた窓関数は、分析対象となる音声に関わらず固定されたものを使用していたため、対象となる音声によっては音声分析がうまくいかなくなる可能性があった。そこで、音声から抽出したF0の情報を用いてラグ窓の形状を適応的に調整することで、音声毎に適応的な分析を行い、ラグ窓を用いた音声分析系を更に精緻化させる手法を提案する。 |
(英) |
The lag window method is based on a source-filter model, which separates the source information from the filter information by smoothing the spectrum through a lag window over the autocorrelation function of the speech.
However, the window function used for the lag window in this method is fixed regardless of the target speech, so the speech analysis may not be successful depending on the target speech.
Therefore, we proposed a method that can adaptively analyze each voice by adaptively adjusting the shape of the lag window using the F0 information extracted from the voice. |
キーワード |
(和) |
音声分析 / ラグ窓 / F0適応 / 二項係数窓 / 半値幅 / / / |
(英) |
speech analysis / lag window / F0-adaptive / binomial window / half-width / / / |
文献情報 |
信学技報, vol. 122, no. 81, SP2022-21, pp. 90-93, 2022年6月. |
資料番号 |
SP2022-21 |
発行日 |
2022-06-10 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2022-21 |