講演抄録/キーワード |
講演名 |
2015-12-03 09:25
統計的パラメトリック音声合成のためのFFTスペクトルからのDeep Auto-encoderに基づく低次元音響特徴量抽出 ○高木信二・山岸順一(NII) SP2015-81 |
抄録 |
(和) |
統計的パラメトリック音声合成システムでは,正確かつ安定したスペクトル包絡を推定するため,STRAIGHTスペクトル解析器のような音声解析モジュールが用いられ,得られたスペクトル包絡から抽出された低次元特徴量が音響モデル構築に用いられることが多い.しかし,音声合成の目標を正確なスペクトル包絡の抽出,モデル化,予測ではなく音声波形の再現と考えた場合,音声波形もしくはより原信号に近い入力を利用し,音声波形との誤差を少なくするという方向性も考えられる.本論文では,統計的パラメトリック音声合成において,Deep Auto-encoderを用い,より原信号近いFFTスペクトルから低次元音響特徴量を抽出することを検討する.テキスト音声合成実験において,異なるスペクトル推定(STRAIGHT,WORLD,FFT),低次元特徴量抽出 (メルケプストラム分析,DeepAuto-encoder),音響モデル (HMM,DNN)を組み合わせた7種類のテキスト音声合成システムを構築し比較を行い,評価を行った. |
(英) |
In the state-of-the-art statistical parametric speech synthesis system, a speech analysis module, e.g. STRAIGHT spectral analysis, is generally used for obtaining accurate and stable spectral envelopes, and then low-dimensional acoustic features extracted from obtained spectral envelopes are used for training acoustic models. However, a spectral envelope estimation algorithm used in such a speech analysis module includes various processing derived from human knowledge. In this paper, we investigate a deep auto-encoder based, non-linear, data-driven and unsupervised low-dimensional feature extraction using FFT spectral envelopes for statistical parametric speech synthesis. Experimental results have shown that a text-to-speech synthesis system using a deep auto-encoder based low-dimensional feature extraction from FFT spectral envelopes is indeed a promising approach. |
キーワード |
(和) |
統計的パラメトリック音声合成 / DNN / Deep Auto-encoder / スペクトル包絡 / ボコーダ / / / |
(英) |
Statistical parametric speech synthesis / DNN / Deep Auto-encoder / Spectral envelope / Vocoder / / / |
文献情報 |
信学技報, vol. 115, no. 346, SP2015-81, pp. 99-104, 2015年12月. |
資料番号 |
SP2015-81 |
発行日 |
2015-11-25 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
SP2015-81 |
研究会情報 |
研究会 |
NLC IPSJ-NL SP IPSJ-SLP |
開催期間 |
2015-12-02 - 2015-12-04 |
開催地(和) |
名古屋工業大学 |
開催地(英) |
Nagoya Inst of Tech. |
テーマ(和) |
第2回自然言語処理シンポジウム & 第17回音声言語シンポジウム |
テーマ(英) |
The Second Natural Language Processing Symposium & The 17th Spoken Language Symposium |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2015-12-NLC-NL-SP-SLP |
本文の言語 |
日本語 |
タイトル(和) |
統計的パラメトリック音声合成のためのFFTスペクトルからのDeep Auto-encoderに基づく低次元音響特徴量抽出 |
サブタイトル(和) |
|
タイトル(英) |
Deep Auto-encoder based Low-dimensional Feature Extraction using FFT Spectral Envelopes in Statistical Parametric Speech Synthesis |
サブタイトル(英) |
|
キーワード(1)(和/英) |
統計的パラメトリック音声合成 / Statistical parametric speech synthesis |
キーワード(2)(和/英) |
DNN / DNN |
キーワード(3)(和/英) |
Deep Auto-encoder / Deep Auto-encoder |
キーワード(4)(和/英) |
スペクトル包絡 / Spectral envelope |
キーワード(5)(和/英) |
ボコーダ / Vocoder |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
高木 信二 / Shinji Takaki / |
第1著者 所属(和/英) |
国立情報学研究所 (略称: NII)
National Institute of Informatics (略称: NII) |
第2著者 氏名(和/英/ヨミ) |
山岸 順一 / Junichi Yamagishi / |
第2著者 所属(和/英) |
国立情報学研究所 (略称: NII)
National Institute of Informatics (略称: NII) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2015-12-03 09:25:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
SP2015-81 |
巻番号(vol) |
vol.115 |
号番号(no) |
no.346 |
ページ範囲 |
pp.99-104 |
ページ数 |
6 |
発行日 |
2015-11-25 (SP) |