お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2014-05-25 11:30
[一般発表]スパース表現に基づく声質変換のための結合型restricted Boltzmann machine
中鹿 亘滝口哲也有木康雄神戸大SP2014-34
抄録 (和) 近年,声質変換の研究分野において,over-fitting や over-smoothing の生じにくいスパース表現に基づく手 法が注目を浴びている.スパース表現に基づく声質変換法では,予め入力話者・出力話者のパラレル辞書を求めてお き,スパースな辞書選択重みを用いて適切な辞書を選択することで声質変換を実現する.この手法は主に 2 つのアプ ローチに分けることができる.1 つ目はパラレル辞書として,学習データの音響特徴量をそのまま辞書として用いる アプローチであり,もう 1 つは,パラレル辞書そのものを何らかの手法で学習させるアプローチである.本研究では, 後者のアプローチに基づき,近年注目を浴びている Deep Learning の基礎技術となる restricted Bolzmann machine (RBM) を用いて,入力話者・出力話者のパラレル辞書を体系的に求める手法を提案する.評価実験では,代表的な手 法である Gaussian mixture model (GMM) だけでなく,従来のスパース表現に基づく手法である non-negative matrix factorization (NMF) による声質変換法に比べて高い精度が得られたことを確認した. 
(英) In voice conversion, sparse-representation-based methods have recently been garnering attention because they are, relatively speaking, not affected by over-fitting or over-smoothing problems. In these approaches, voice conversion is achieved by estimating a sparse vector that determines which dictionaries of the target speaker should be used, calculated from the matching of the input vector and dictionaries of the source speaker. The sparse-representation-based voice conversion methods can be broadly divided into two approaches: 1) an approach that uses raw acoustic features in the training data as parallel dictionaries, and 2) an approach that trains parallel dictionaries from the training data. Our approach belongs to the latter; we systematically estimate the parallel dictionaries using a restricted Boltzmann machine, a fundamental technology commonly used in deep learning. Through voice-conversion experiments, we confirmed the high-performance of our method, comparing it with the conventional Gaussian mixture model (GMM)-based approach, and a non-negative matrix factorization (NMF)-based approach, which is based on sparse-representation.
キーワード (和) 声質変換 / restricted Boltzmann machine / スパース表現 / パラレル辞書学習 / / / /  
(英) Voice conversion / restricted Boltzmann machine / sparse representation / parallel dictionary learning / / / /  
文献情報 信学技報, vol. 114, no. 52, SP2014-34, pp. 343-348, 2014年5月.
資料番号 SP2014-34 
発行日 2014-05-17 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2014-34

研究会情報
研究会 SP IPSJ-MUS  
開催期間 2014-05-24 - 2014-05-25 
開催地(和) 日本大学文理学部キャンパス 百周年記念館 
開催地(英)  
テーマ(和) 音学シンポジウム2014 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2014-05-SP-MUS 
本文の言語 日本語 
タイトル(和) [一般発表]スパース表現に基づく声質変換のための結合型restricted Boltzmann machine 
サブタイトル(和)  
タイトル(英) A joint restricted Boltzmann machine for dictionary learning in sparse-representation-based voice conversion 
サブタイトル(英)  
キーワード(1)(和/英) 声質変換 / Voice conversion  
キーワード(2)(和/英) restricted Boltzmann machine / restricted Boltzmann machine  
キーワード(3)(和/英) スパース表現 / sparse representation  
キーワード(4)(和/英) パラレル辞書学習 / parallel dictionary learning  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 中鹿 亘 / Toru Nakashika / ナカシカ トオル
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第2著者 氏名(和/英/ヨミ) 滝口 哲也 / Tetsuya Takiguchi / タキグチ テツヤ
第2著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第3著者 氏名(和/英/ヨミ) 有木 康雄 / Yasuo Ariki / アリキ ヤスオ
第3著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2014-05-25 11:30:00 
発表時間 240分 
申込先研究会 SP 
資料番号 SP2014-34 
巻番号(vol) vol.114 
号番号(no) no.52 
ページ範囲 pp.343-348 
ページ数
発行日 2014-05-17 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会