講演抄録/キーワード |
講演名 |
2013-12-20 14:25
[記念講演]東芝の音声合成技術 ~ 閉ループ学習から最近の取り組みまで ~ ○赤嶺政巳(東芝) SP2013-92 |
抄録 |
(和) |
本稿では、東芝の音声合成技術について、閉ループ学習に基づく音声素片生成から最近の取り組みまでを紹介する。初期の開発では、カーナビなどの情報機器における音声による情報伝達を目的に、高音質、自然性の実現に注力してきた。最近では、インターネット上の音声コンテンツ作成や音声対話インターフェースへの適用に向けて、特定の話者の声や話し方に合成音をカスタマイズする技術、感情的な音声の合成を実現する技術、および応用システムの開発に取り組んでいる。 |
(英) |
This article presents Text to Speech (TTS) technologies in Toshiba, closed-loop training methods to our recent efforts at meeting customer needs. We focused on high-quality speech synthesis with small foot prints in the beginnings of research and development in Toshiba. This focus was for deploying TTS to embedded systems such as in-car navigation systems. Recently, we have aimed at flexible speech synthesis to create a wide variety of voices, speaking styles, and emotions for applications of contents creation and interactive human-machine interfaces. |
キーワード |
(和) |
音声合成 / 閉ループ学習、 / カスタムボイス / 感情音声 / / / / |
(英) |
Speech synthesis / Text to Speech / Closed-loop training / Custom voice / Emotional voice / / / |
文献情報 |
信学技報, vol. 113, no. 366, SP2013-92, pp. 115-118, 2013年12月. |
資料番号 |
SP2013-92 |
発行日 |
2013-12-12 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-92 |