お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2020-03-02 09:20
複数話者WaveNetボコーダを用いたニューラル話速変換の試み
岡本拓磨NICT)・松原圭亮神戸大/NICT)・戸田智基名大/NICT)・志賀芳則河井 恒NICTEA2019-101 SIP2019-103 SP2019-50
抄録 (和) 音の高さを変えずに音声を伸縮する話速変換技術は,従来 WSOLA や STRIGHT ボコーダ等の信号処理 により実現されたきたが,特に時間を引き伸ばす方向については音質が劣化してしまう問題がある.そこで本稿では, 近年テキスト音声合成や声質変換において高品質な音声を合成可能であるニューラルボコーダを用いた話速変換につ いての検討を行う.初期検討として,日本語複数話者公開音声コーパス JVS を用いて複数話者 WaveNet ボコーダを 学習し,音響特徴量をリサンプリングにより時間伸縮させることにより話速変換を実現する.学習に用いていない日 本人女性話者の音声を用いた聴取実験により,提案法を WSOLA および STRAIGHT と比較する.実験結果より,提 案法の方が高品質な話速変換音声を合成可能であることを示す. 
(英) Speech rate conversion technology, which can expand or compress speech waveforms without changing pitch of sound, is conventionally realized by signal processing-based methods such as WSOLA and STRAIGHT vocoder. However, the synthesis quality of speech waveforms expanded by these methods is sometimes degraded. To realize high-quality speech rate conversion, this paper investigates neural speech rate conversion using neural vocoders which can synthesize high-fidelity speech waveforms in text-to-speech and voice conversion. As an initial investigation, multi-speaker WaveNet vocoder is trained using JVS corpus for Japanese and neural speech rate con- version is realized by expanding or compressing input acoustic features in inference. The proposed neural speech rate conversion with multi-speaker WaveNet vocoder is compared with the conventional WSOLA and STRAIGHT vocoder in experiments using Japanese female speech samples not included in the training data. The results of exper- iments indicate that the proposed approach can realize higher-quality speech rate conversion than the conventional methods.
キーワード (和) ニューラル話速変換 / WSOLA / ニューラルボコーダ / 複数話者 WaveNet ボコーダ / リサンプリング / / /  
(英) Neural speech rate conversion / WSOLA / Neural vocoder / Multi-speaker WaveNet vocoder / Resampling / / /  
文献情報 信学技報, vol. 119, no. 441, SP2019-50, pp. 1-6, 2020年3月.
資料番号 SP2019-50 
発行日 2020-02-24 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2019-101 SIP2019-103 SP2019-50

研究会情報
研究会 SP EA SIP  
開催期間 2020-03-02 - 2020-03-03 
開催地(和) 沖縄産業支援センター 
開催地(英) Okinawa Industry Support Center 
テーマ(和) 音声,応用/電気音響,信号処理,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2020-03-SP-EA-SIP 
本文の言語 日本語 
タイトル(和) 複数話者WaveNetボコーダを用いたニューラル話速変換の試み 
サブタイトル(和)  
タイトル(英) Investigation of neural speech rate conversion with multi-speaker WaveNet vocoder 
サブタイトル(英)  
キーワード(1)(和/英) ニューラル話速変換 / Neural speech rate conversion  
キーワード(2)(和/英) WSOLA / WSOLA  
キーワード(3)(和/英) ニューラルボコーダ / Neural vocoder  
キーワード(4)(和/英) 複数話者 WaveNet ボコーダ / Multi-speaker WaveNet vocoder  
キーワード(5)(和/英) リサンプリング / Resampling  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 岡本 拓磨 / Takuma Okamoto / オカモト タクマ
第1著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第2著者 氏名(和/英/ヨミ) 松原 圭亮 / Keisuke Matsubara / マツバラ ケイスケ
第2著者 所属(和/英) 神戸大学/情報通信研究機構 (略称: 神戸大/NICT)
Kobe University/National Institute of Information and Communications Technology (略称: Kobe Univ./NICT)
第3著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第3著者 所属(和/英) 名古屋大学/情報通信研究機構 (略称: 名大/NICT)
Nagoya University/National Institute of Information and Communications Technology (略称: Nagoya Univ./NICT)
第4著者 氏名(和/英/ヨミ) 志賀 芳則 / Yoshinori Shiga / シガ ヨシノリ
第4著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第5著者 氏名(和/英/ヨミ) 河井 恒 / Hisashi Kawai / カワイ ヒサシ
第5著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2020-03-02 09:20:00 
発表時間 25分 
申込先研究会 SP 
資料番号 EA2019-101, SIP2019-103, SP2019-50 
巻番号(vol) vol.119 
号番号(no) no.439(EA), no.440(SIP), no.441(SP) 
ページ範囲 pp.1-6 
ページ数
発行日 2020-02-24 (EA, SIP, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会