研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-5 |
Harmonic-Net+はWORLD特徴量で動作する,基本周波数~(fo)および話速~(SR)制御可能な高速ニューラル... [more] |
SP2023-5 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-15 |
近年,VITSやJETSといったモデルを用いることで高速かつ高品質なテキスト音声合成~(Text-toSpeech:~T... [more] |
SP2023-15 pp.73-78 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-75 SIP2022-119 SP2022-39 |
深層ニューラルネットワークを用いて音響特徴量から音声波形を生成するニューラルボコーダは,従来のソースフィルタボコーダに比... [more] |
EA2022-75 SIP2022-119 SP2022-39 pp.1-6 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速 ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-76 SIP2022-120 SP2022-40 |
近年テキスト音声合成~(Text-to-Speech:~TTS)では品質を保ったまま推論速度を向上することが求められてお... [more] |
EA2022-76 SIP2022-120 SP2022-40 pp.7-12 |
WIT, HI-SIGACI (連催) |
2022-12-08 14:30 |
東京 |
産総研臨海副都心センター(東京) |
映画の音声ガイド制作における経験者と初心者の差異 ○栗山稜平・中島佐和子・水戸部一孝(秋田大) WIT2022-11 |
近年,視覚障がい者の動画鑑賞支援のための音声ガイド制作に関する研究では,音声ガイド制作初心者を制作過程に参加させることで... [more] |
WIT2022-11 pp.41-46 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-18 10:50 |
ONLINE |
オンライン開催 |
[招待講演]Crazy vocoderは砕けない ~ でもちょっとくだけた未来の話を ~ ○森勢将雅(明大) SP2022-15 |
現在の音声合成研究者が論文にVocoderと記載するとき,その多くはDeep neural network (DNN)を... [more] |
SP2022-15 pp.61-66 |
SIS |
2021-03-04 09:00 |
ONLINE |
オンライン開催 |
ソースフィルタ型音声合成の敵対的学習による最適化 ○光井勇人・杉浦陽介・安井希子・島村徹也(埼玉大) SIS2020-35 |
本研究は,深層学習を用いたソースフィルタ型の音声波形生成モデルの精度向上を目的とする.ソースフィルタ型の音声波形生成モデ... [more] |
SIS2020-35 pp.1-4 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]統合型ソースフィルタネットワークによるニューラルボコーダ ○米山怜於・呉 宜樵・戸田智基(名大) EA2020-69 SIP2020-100 SP2020-34 |
本稿では,ソースフィルタ理論に基づくニューラルボコーダを単一のネットワークにより実現する手法を提案する.深層学習に基づく... [more] |
EA2020-69 SIP2020-100 SP2020-34 pp.57-62 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]雑音の基底信号を用いた耐雑音性の高い時間領域音声分離 ○尾座本耕平(東工大)・岩野公司(東京都市大)・宇都有昭・篠田浩一(東工大) EA2020-70 SIP2020-101 SP2020-35 |
近年,深層学習を用いた音声分離が盛んに研究されている.波形を直接入力する時間領域の手法であるTasNetは,音声を畳み込... [more] |
EA2020-70 SIP2020-101 SP2020-35 pp.63-67 |
SIS |
2020-03-06 15:00 |
埼玉 |
埼玉会館 (開催中止,技報発行あり) |
音声強調ネットワークのためのSelf-Attention機構を用いた敵対的学習 ○杉浦陽介・島村徹也(埼玉大) SIS2019-59 |
本稿は,音声強調ネットワークの性能改善に向けた新たな敵対的学習法を提案する.
提案手法では,まず生成した音声波形に対し... [more] |
SIS2019-59 pp.125-129 |
SP, EA, SIP (共催) |
2020-03-02 09:20 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
複数話者WaveNetボコーダを用いたニューラル話速変換の試み ○岡本拓磨(NICT)・松原圭亮(神戸大/NICT)・戸田智基(名大/NICT)・志賀芳則・河井 恒(NICT) EA2019-101 SIP2019-103 SP2019-50 |
音の高さを変えずに音声を伸縮する話速変換技術は,従来 WSOLA や STRIGHT ボコーダ等の信号処理 により実現さ... [more] |
EA2019-101 SIP2019-103 SP2019-50 pp.1-6 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
時間反転音声を用いた音声認識のためのデータ拡張 ~ 特徴量系列における反転 ~ ○芦原孝典・田中智大・森谷崇史・増村 亮・篠原雄介・柏野牧夫(NTT) EA2019-110 SIP2019-112 SP2019-59 |
音声認識システムにおいて,学習データの音響的な網羅性を可能な限り担保し,過学習を防ぐ事を目的としたアプローチの一つに d... [more] |
EA2019-110 SIP2019-112 SP2019-59 pp.53-58 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
組み込み向けHMM音声合成における大規模音声コーパスの利用に関する検討 ○西澤信行・小原朋広・石先広海(KDDI総合研究所) EA2019-141 SIP2019-143 SP2019-90 |
組み込み機器向けのHMM音声合成技術に基づく音声合成システムで,59.3時間の大規模音声コーパスから学習したサイズの大き... [more] |
EA2019-141 SIP2019-143 SP2019-90 pp.231-236 |
EA |
2019-12-12 14:25 |
福岡 |
九州工業大学戸畑キャンパス(北九州市) |
雑音情報を含めたマルチタスク学習による音声強調ネットワークの性能改善 ○田中晴樹(徳山高専)・杉浦陽介・安井希子・島村徹也(埼玉大)・宮崎亮一(徳山高専) EA2019-70 |
現在,信号処理分野では音声強調に対する関心が高まっている.近年,深層学習を用いた多くの音声強調手法が提案されており,その... [more] |
EA2019-70 pp.31-36 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2019-12-06 10:35 |
東京 |
NHK放送技術研究所 |
[招待講演]統計的音声合成の進展と展望 ○徳田恵一(名工大) SP2019-35 |
統計的音声合成の基本問題は次の通り記述することができる:「学習用の音声データベース(音声波形と対応するテキストの組の集合... [more] |
SP2019-35 pp.11-12 |
SP |
2019-08-28 14:40 |
京都 |
京都大学 |
[ポスター講演]模擬難聴処理を活用した音声波形加工に基づく明瞭度改善 ○彦坂 秀・小林和弘・林 知樹・関 翔悟・武田一哉(名大)・坂野秀樹(名城大)・戸田智基(名大) SP2019-13 |
医学的な治療が困難である感音性難聴は,補聴器による聴覚機能の補助を行うのが一般的である.補聴器では,入力信号に対して周波... [more] |
SP2019-13 pp.25-29 |
SP |
2019-08-28 14:40 |
京都 |
京都大学 |
[ポスター講演]End-to-End型テキスト音声合成におけるWaveNetボコーダの学習についての調査 ○安原和輝・林 知樹・戸田智基(名大) SP2019-14 |
本稿では,End-to-Endテキスト音声合成(E2E-TTS)におけるWaveNetボコーダの学習についての調査を行う... [more] |
SP2019-14 pp.31-36 |
EA, SIP, SP (共催) |
2019-03-14 13:30 |
長崎 |
アイランド ナガサキ(長崎市) |
[ポスター講演]Initial analysis of emotional speech acted in noise ○Yi Zhao(NII)・Atsushi Ando(NTT)・Shinji Takaki・Junichi Yamagishi(NII)・Satoshi Kobashikawa(NTT) EA2018-120 SIP2018-126 SP2018-82 |
[more] |
EA2018-120 SIP2018-126 SP2018-82 pp.125-130 |
SP |
2019-01-27 09:00 |
石川 |
ハルモニー金沢 |
[チュートリアル招待講演]エンドツーエンド音声合成に向けたNIIにおけるソフトウェア群 ~ TacotronとWaveNetのチュートリアル ~ ○安田裕介・シン ワン(NII) SP2018-56 |
この発表ではエンドツーエンド音声合成について解説する.エンドツーエンド音声合成の主要なアプローチを紹介し,私達の取り組み... [more] |
SP2018-56 p.21 |
SIP, EA, SP (共催) MI (併催) [詳細] |
2018-03-20 09:00 |
沖縄 |
石垣島 ホテルミヤヒラ |
[ポスター講演]A Hybrid Approach on Electrolaryngeal Speech Enhancement based on Spectral Differential Features and Noise Suppression ○Mohammad Eshghi・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) EA2017-141 SIP2017-150 SP2017-124 |
This work presents a hybrid approach for enhancing the quali... [more] |
EA2017-141 SIP2017-150 SP2017-124 pp.221-226 |