お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2014-05-25 11:30
[研究紹介]サブバンド領域での音声波形生成
西澤信行加藤恒夫KDDI研SP2014-35
抄録 (和) HMM音声合成等の分析合成方式に基づく音声合成システムにおける波形生成処理を高速化するため, MPEGオーディオ符号化で用いられるサブバンド符号化技術を応用し, サブバンド符号領域で波形生成処理を行う方法を紹介する. HMM音声合成技術に基づく音声合成システムは小さいフットプリントで比較的高い品質の音声を合成できるが, 波形生成処理で必要な処理量が, 従来の波形接続合成で必要な処理量よりも大きくなるという課題がある. 組み込み向けのシステム等では低演算量であることが求められることも多いため, 我々は, サブバンド符号化技術を応用した波形生成処理手法を提案している. 提案手法では正弦波と帯域分割された白色雑音を組み合わせて音声波形を生成するが, このような帯域制限された波形に対してサブバンド符号化を行うと, スパースなサブバンド符号ベクトルが得られることから, 同様の処理を時間領域で行った場合よりも, サブバンド符号の復号処理を考慮してなお高速な処理を実現することができる. また, 提案手法をメルケプストラムに基づくHMM音声合成システムに適用する際に必要となる, スペクトル包絡特性の計算処理に, サブバンド符号の復号で用いられる高速離散コサイン変換アルゴリズムを用いる方法についても紹介する. 
(英) To reduce the computational cost for waveform generation in speech synthesis based on analysis-synthesis systems like HMM-based speech synthesizers, a method based on the subband coding, which is also used in MPEG Audio, is introduced. In the method, signal processing is performed on the subband domain rather than the time domain. Although the HMM-based speech synthesis can generate relatively high quality sound in a small footprint, the computational cost for the waveform generation process is higher than that of the conventional concatenative speech synthesis directly using waveform segments. Since a low amount of computations is often required in small systems such as embedded systems, we proposed the subband-coding-based method to reduce the computational cost in our former studies. In the method, speech waveforms are generated by combining sinusoids and band-decomposed white noises. Because subband code vectors for such waveforms result in sparse vectors, the computational cost can be reduced by processing on the subband domain even where the cost for decoding of the subband code vectors is taken into account. Moreover, a method for the computation of spectral convolutions from melcepstra using a fast discrete cosine transformation algorithm is also introduced. It would be required in HMM-based speech synthesizers with the proposed waveform generation method in practice.
キーワード (和) HMM音声合成 / 音声波形生成 / フィルタバンク / サブバンド符号化 / 組み込みシステム / / /  
(英) HMM-based speech synthesis / speech waveform generation / filter bank / subband coding / embedded systems / / /  
文献情報 信学技報, vol. 114, no. 52, SP2014-35, pp. 349-354, 2014年5月.
資料番号 SP2014-35 
発行日 2014-05-17 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2014-35

研究会情報
研究会 SP IPSJ-MUS  
開催期間 2014-05-24 - 2014-05-25 
開催地(和) 日本大学文理学部キャンパス 百周年記念館 
開催地(英)  
テーマ(和) 音学シンポジウム2014 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2014-05-SP-MUS 
本文の言語 日本語 
タイトル(和) [研究紹介]サブバンド領域での音声波形生成 
サブタイトル(和)  
タイトル(英) Speech waveform generation on subband domain 
サブタイトル(英)  
キーワード(1)(和/英) HMM音声合成 / HMM-based speech synthesis  
キーワード(2)(和/英) 音声波形生成 / speech waveform generation  
キーワード(3)(和/英) フィルタバンク / filter bank  
キーワード(4)(和/英) サブバンド符号化 / subband coding  
キーワード(5)(和/英) 組み込みシステム / embedded systems  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 西澤 信行 / Nobuyuki Nishizawa / ニシザワ ノブユキ
第1著者 所属(和/英) 株式会社KDDI研究所 (略称: KDDI研)
KDDI R&D Laboratories, Inc. (略称: KDDI R&D Labs)
第2著者 氏名(和/英/ヨミ) 加藤 恒夫 / Tsuneo Kato / カトウ ツネオ
第2著者 所属(和/英) 株式会社KDDI研究所 (略称: KDDI研)
KDDI R&D Laboratories, Inc. (略称: KDDI R&D Labs)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2014-05-25 11:30:00 
発表時間 240分 
申込先研究会 SP 
資料番号 SP2014-35 
巻番号(vol) vol.114 
号番号(no) no.52 
ページ範囲 pp.349-354 
ページ数
発行日 2014-05-17 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会