講演抄録/キーワード |
講演名 |
2022-06-18 10:50
[招待講演]Crazy vocoderは砕けない ~ でもちょっとくだけた未来の話を ~ ○森勢将雅(明大) SP2022-15 |
抄録 |
(和) |
現在の音声合成研究者が論文にVocoderと記載するとき,その多くはDeep neural network (DNN)を用いて何らかのパラメータから高品質な音声波形を生成するNeural vocoderを指すのではないだろうか.もしそうであれば,音声符号化という役割ではなく,高品質な音声を合成したいという高品質Vocoderが持つ『黄金の精神』が,Neural vocoder世代に受け継がれたことを意味する.本稿では,恐らく今後失われていくであろう伝統的なVocoderの波形生成部のアルゴリズム,および一連の知識がまだ音声研究において役立つかという将来展望について紹介する. |
(英) |
When current speech synthesis researchers refer to Vocoder in their papers, they are most likely referring to Neural vocoder, which generates high-quality speech from parameters by using deep neural networks (DNN). If so, the "golden spirit" of a high-quality vocoder, which is to synthesize high-quality speech rather than play the role of speech encoding, has been passed on to the Neural vocoder generation. This paper presents the core algorithms in the waveform generation of traditional vocoder, which will probably be lost in the future, and prospects for how this body of knowledge can still be useful in speech research. |
キーワード |
(和) |
音声合成 / Vocoder / テキスト音声合成 / 声質変換 / 音声デザイン / / / |
(英) |
Speech synthesis / Vocoder / Text-to-speech synthesis / Voice conversion / Speech design / / / |
文献情報 |
信学技報, vol. 122, no. 81, SP2022-15, pp. 61-66, 2022年6月. |
資料番号 |
SP2022-15 |
発行日 |
2022-06-10 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2022-15 |