お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2020-06-12 13:30
CycleGANに基づく構音障害音声の明瞭性改善
今井柊平能勢 隆金垣 葵東北大)・渡辺 聡ヒューマンテクノシステム)・伊藤彰則東北大WIT2020-1
抄録 (和) 本稿では非ペア声質変換のタスクで有効性が示されているCycleGAN-VC2を使用して構音障害音声から複数話者の健常音声への変換を学習することで明瞭性の改善を検討する.以前から音声合成技術や声質変換技術を用いて構音障害者のコミュニケーションを支援する試みが行われてきた.特に近年では深層学習による手法が様々なタスクで優れた結果を残していることから,これを用いた手法が検討されてきている.しかしながら高品質な手法は構音障害音声の大規模コーパスを構築する必要があり,これは構音障害者にとって負担が大きく困難である.一方,健常音声のコーパスとしては既存のものが様々存在するため,大量に学習に使用することが可能である.そこで本研究では,学習に使用する健常音声として複数話者を使用することで,比較的少量の構音障害音声にもかかわらず明瞭性を改善する手法を検討する.健常音声として単一話者と複数話者を使用し,複数話者の場合は話者数の違いにより複数のデータセットを作成した.これらの各条件でCycleGAN-VC2の学習を行い,得られた音声を主観・客観的に評価することで性能を比較した. 
(英) Several voice conversion systems have been developed that converts the dysarthric speech into healthy speech.The conventional methods, however, require a large amount of dysarthric speech for realizing a high-quality voice output.Preparing such a database is burdensome for those people with dysarthria.In this paper, we investigate a method to improve intelligibility by learning the conversion from dysarthric speech to healthy speech with multiple speakers using CycleGAN-VC2, an efficient and high-quality VC algorithm in the task of unpaired voice conversion.We trained VC models with CycleGAN-VC2 using healthy speech with multiple speaker and relatively small amount of dysarthric speech, and compared the performance of converted speech by subjective and objective evaluation.
キーワード (和) 構音障害 / 明瞭性 / 声質変換 / CycleGAN / / / /  
(英) Dysarthria / Pronounce clarity / Voice conversion / CycleGAN / / / /  
文献情報 信学技報, vol. 120, no. 63, WIT2020-1, pp. 1-6, 2020年6月.
資料番号 WIT2020-1 
発行日 2020-06-05 (WIT) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード WIT2020-1

研究会情報
研究会 WIT  
開催期間 2020-06-12 - 2020-06-12 
開催地(和) オンライン開催(大阪産業大学から変更) 
開催地(英) Online 
テーマ(和) 福祉情報工学、一般 
テーマ(英) Well-being Information Technology, etc. 
講演論文情報の詳細
申込み研究会 WIT 
会議コード 2020-06-WIT 
本文の言語 日本語 
タイトル(和) CycleGANに基づく構音障害音声の明瞭性改善 
サブタイトル(和)  
タイトル(英) Improving the pronounce clarity of dysarthric speech using CycleGAN 
サブタイトル(英)  
キーワード(1)(和/英) 構音障害 / Dysarthria  
キーワード(2)(和/英) 明瞭性 / Pronounce clarity  
キーワード(3)(和/英) 声質変換 / Voice conversion  
キーワード(4)(和/英) CycleGAN / CycleGAN  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 今井 柊平 / Shuhei Imai / イマイ シュウヘイ
第1著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第2著者 氏名(和/英/ヨミ) 能勢 隆 / Takashi Nose / ノセ タカシ
第2著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第3著者 氏名(和/英/ヨミ) 金垣 葵 / Aoi Kanagaki / カナガキ アオイ
第3著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第4著者 氏名(和/英/ヨミ) 渡辺 聡 / Satoshi Watanabe / ワタナベ サトシ
第4著者 所属(和/英) ヒューマンテクノシステム (略称: ヒューマンテクノシステム)
Human Techno System (略称: HTS)
第5著者 氏名(和/英/ヨミ) 伊藤 彰則 / Akinori Ito / イトウ アキノリ
第5著者 所属(和/英) 東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2020-06-12 13:30:00 
発表時間 30分 
申込先研究会 WIT 
資料番号 WIT2020-1 
巻番号(vol) vol.120 
号番号(no) no.63 
ページ範囲 pp.1-6 
ページ数
発行日 2020-06-05 (WIT) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会