お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-12-03 09:25
統計的パラメトリック音声合成のためのFFTスペクトルからのDeep Auto-encoderに基づく低次元音響特徴量抽出
高木信二山岸順一NIISP2015-81
抄録 (和) 統計的パラメトリック音声合成システムでは,正確かつ安定したスペクトル包絡を推定するため,STRAIGHTスペクトル解析器のような音声解析モジュールが用いられ,得られたスペクトル包絡から抽出された低次元特徴量が音響モデル構築に用いられることが多い.しかし,音声合成の目標を正確なスペクトル包絡の抽出,モデル化,予測ではなく音声波形の再現と考えた場合,音声波形もしくはより原信号に近い入力を利用し,音声波形との誤差を少なくするという方向性も考えられる.本論文では,統計的パラメトリック音声合成において,Deep Auto-encoderを用い,より原信号近いFFTスペクトルから低次元音響特徴量を抽出することを検討する.テキスト音声合成実験において,異なるスペクトル推定(STRAIGHT,WORLD,FFT),低次元特徴量抽出 (メルケプストラム分析,DeepAuto-encoder),音響モデル (HMM,DNN)を組み合わせた7種類のテキスト音声合成システムを構築し比較を行い,評価を行った. 
(英) In the state-of-the-art statistical parametric speech synthesis system, a speech analysis module, e.g. STRAIGHT spectral analysis, is generally used for obtaining accurate and stable spectral envelopes, and then low-dimensional acoustic features extracted from obtained spectral envelopes are used for training acoustic models. However, a spectral envelope estimation algorithm used in such a speech analysis module includes various processing derived from human knowledge. In this paper, we investigate a deep auto-encoder based, non-linear, data-driven and unsupervised low-dimensional feature extraction using FFT spectral envelopes for statistical parametric speech synthesis. Experimental results have shown that a text-to-speech synthesis system using a deep auto-encoder based low-dimensional feature extraction from FFT spectral envelopes is indeed a promising approach.
キーワード (和) 統計的パラメトリック音声合成 / DNN / Deep Auto-encoder / スペクトル包絡 / ボコーダ / / /  
(英) Statistical parametric speech synthesis / DNN / Deep Auto-encoder / Spectral envelope / Vocoder / / /  
文献情報 信学技報, vol. 115, no. 346, SP2015-81, pp. 99-104, 2015年12月.
資料番号 SP2015-81 
発行日 2015-11-25 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.
PDFダウンロード SP2015-81

研究会情報
研究会 NLC IPSJ-NL SP IPSJ-SLP  
開催期間 2015-12-02 - 2015-12-04 
開催地(和) 名古屋工業大学 
開催地(英) Nagoya Inst of Tech. 
テーマ(和) 第2回自然言語処理シンポジウム & 第17回音声言語シンポジウム 
テーマ(英) The Second Natural Language Processing Symposium & The 17th Spoken Language Symposium 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2015-12-NLC-NL-SP-SLP 
本文の言語 日本語 
タイトル(和) 統計的パラメトリック音声合成のためのFFTスペクトルからのDeep Auto-encoderに基づく低次元音響特徴量抽出 
サブタイトル(和)  
タイトル(英) Deep Auto-encoder based Low-dimensional Feature Extraction using FFT Spectral Envelopes in Statistical Parametric Speech Synthesis 
サブタイトル(英)  
キーワード(1)(和/英) 統計的パラメトリック音声合成 / Statistical parametric speech synthesis  
キーワード(2)(和/英) DNN / DNN  
キーワード(3)(和/英) Deep Auto-encoder / Deep Auto-encoder  
キーワード(4)(和/英) スペクトル包絡 / Spectral envelope  
キーワード(5)(和/英) ボコーダ / Vocoder  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 高木 信二 / Shinji Takaki /
第1著者 所属(和/英) 国立情報学研究所 (略称: NII)
National Institute of Informatics (略称: NII)
第2著者 氏名(和/英/ヨミ) 山岸 順一 / Junichi Yamagishi /
第2著者 所属(和/英) 国立情報学研究所 (略称: NII)
National Institute of Informatics (略称: NII)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2015-12-03 09:25:00 
発表時間 25分 
申込先研究会 SP 
資料番号 SP2015-81 
巻番号(vol) vol.115 
号番号(no) no.346 
ページ範囲 pp.99-104 
ページ数
発行日 2015-11-25 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会