講演抄録/キーワード |
講演名 |
2014-05-25 11:30
[一般発表]スパース表現に基づく声質変換のための結合型restricted Boltzmann machine ○中鹿 亘・滝口哲也・有木康雄(神戸大) SP2014-34 |
抄録 |
(和) |
近年,声質変換の研究分野において,over-fitting や over-smoothing の生じにくいスパース表現に基づく手 法が注目を浴びている.スパース表現に基づく声質変換法では,予め入力話者・出力話者のパラレル辞書を求めてお き,スパースな辞書選択重みを用いて適切な辞書を選択することで声質変換を実現する.この手法は主に 2 つのアプ ローチに分けることができる.1 つ目はパラレル辞書として,学習データの音響特徴量をそのまま辞書として用いる アプローチであり,もう 1 つは,パラレル辞書そのものを何らかの手法で学習させるアプローチである.本研究では, 後者のアプローチに基づき,近年注目を浴びている Deep Learning の基礎技術となる restricted Bolzmann machine (RBM) を用いて,入力話者・出力話者のパラレル辞書を体系的に求める手法を提案する.評価実験では,代表的な手 法である Gaussian mixture model (GMM) だけでなく,従来のスパース表現に基づく手法である non-negative matrix factorization (NMF) による声質変換法に比べて高い精度が得られたことを確認した. |
(英) |
In voice conversion, sparse-representation-based methods have recently been garnering attention because they are, relatively speaking, not affected by over-fitting or over-smoothing problems. In these approaches, voice conversion is achieved by estimating a sparse vector that determines which dictionaries of the target speaker should be used, calculated from the matching of the input vector and dictionaries of the source speaker. The sparse-representation-based voice conversion methods can be broadly divided into two approaches: 1) an approach that uses raw acoustic features in the training data as parallel dictionaries, and 2) an approach that trains parallel dictionaries from the training data. Our approach belongs to the latter; we systematically estimate the parallel dictionaries using a restricted Boltzmann machine, a fundamental technology commonly used in deep learning. Through voice-conversion experiments, we confirmed the high-performance of our method, comparing it with the conventional Gaussian mixture model (GMM)-based approach, and a non-negative matrix factorization (NMF)-based approach, which is based on sparse-representation. |
キーワード |
(和) |
声質変換 / restricted Boltzmann machine / スパース表現 / パラレル辞書学習 / / / / |
(英) |
Voice conversion / restricted Boltzmann machine / sparse representation / parallel dictionary learning / / / / |
文献情報 |
信学技報, vol. 114, no. 52, SP2014-34, pp. 343-348, 2014年5月. |
資料番号 |
SP2014-34 |
発行日 |
2014-05-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-34 |
研究会情報 |
研究会 |
SP IPSJ-MUS |
開催期間 |
2014-05-24 - 2014-05-25 |
開催地(和) |
日本大学文理学部キャンパス 百周年記念館 |
開催地(英) |
|
テーマ(和) |
音学シンポジウム2014 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2014-05-SP-MUS |
本文の言語 |
日本語 |
タイトル(和) |
[一般発表]スパース表現に基づく声質変換のための結合型restricted Boltzmann machine |
サブタイトル(和) |
|
タイトル(英) |
A joint restricted Boltzmann machine for dictionary learning in sparse-representation-based voice conversion |
サブタイトル(英) |
|
キーワード(1)(和/英) |
声質変換 / Voice conversion |
キーワード(2)(和/英) |
restricted Boltzmann machine / restricted Boltzmann machine |
キーワード(3)(和/英) |
スパース表現 / sparse representation |
キーワード(4)(和/英) |
パラレル辞書学習 / parallel dictionary learning |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中鹿 亘 / Toru Nakashika / ナカシカ トオル |
第1著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第2著者 氏名(和/英/ヨミ) |
滝口 哲也 / Tetsuya Takiguchi / タキグチ テツヤ |
第2著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第3著者 氏名(和/英/ヨミ) |
有木 康雄 / Yasuo Ariki / アリキ ヤスオ |
第3著者 所属(和/英) |
神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2014-05-25 11:30:00 |
発表時間 |
240分 |
申込先研究会 |
SP |
資料番号 |
SP2014-34 |
巻番号(vol) |
vol.114 |
号番号(no) |
no.52 |
ページ範囲 |
pp.343-348 |
ページ数 |
6 |
発行日 |
2014-05-17 (SP) |
|