研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 16:40 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Sequence-to-sequence Voice Conversion for Electrolaryngeal Speech Enhancement with Multi-stage Pretraining and Fine-tuning Techniques ○Ding Ma・Lester Phillip Violeta・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-32 WIT2023-23 |
Sequence-to-sequence (seq2seq) voice conversion (VC) models ... [more] |
SP2023-32 WIT2023-23 pp.27-32 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 17:05 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Electrolaryngeal Speech Enhancement through Strong Linguistic Encoding Methods ○Lester Phillip Violeta・Wen-Chin Huang・Ding Ma・Ryuichi Yamamoto・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-33 WIT2023-24 |
Although pretraining and fine-tuning approaches have proven ... [more] |
SP2023-33 WIT2023-24 pp.33-38 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-5 |
Harmonic-Net+はWORLD特徴量で動作する,基本周波数~(fo)および話速~(SR)制御可能な高速ニューラル... [more] |
SP2023-5 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-15 |
近年,VITSやJETSといったモデルを用いることで高速かつ高品質なテキスト音声合成~(Text-toSpeech:~T... [more] |
SP2023-15 pp.73-78 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorと音声認識コーパスを用いた多様な発話スタイルに対応する複数話者テキスト音声合成の評価 ○日田光紀(和歌山大/NICT)・岡本拓磨(NICT)・西村竜一(和歌山大)・大谷大和(NICT)・戸田智基(名大/NICT)・河井 恒(NICT) SP2023-25 |
これまでに,合成時に対応できる話者数の増加を目的として,音声認識用コーパスであるCSJを用いて,また話者埋め込みとしてx... [more] |
SP2023-25 pp.125-130 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
基本周波数制御可能な高速ニューラル波形生成モデルの比較 ○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-75 SIP2022-119 SP2022-39 |
深層ニューラルネットワークを用いて音響特徴量から音声波形を生成するニューラルボコーダは,従来のソースフィルタボコーダに比... [more] |
EA2022-75 SIP2022-119 SP2022-39 pp.1-6 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速 ニューラル波形生成モデル ○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) EA2022-76 SIP2022-120 SP2022-40 |
近年テキスト音声合成~(Text-to-Speech:~TTS)では品質を保ったまま推論速度を向上することが求められてお... [more] |
EA2022-76 SIP2022-120 SP2022-40 pp.7-12 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 16:35 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
リー群論に基づく一般化ワーピング ○宮下敦志・戸田智基(名大) EA2022-91 SIP2022-135 SP2022-55 |
音声は順序を持ったデータ系列である.音声スペクトルの周波数軸伸縮や音声の話速制御,テキスト等の別の系列との対応付けなど,... [more] |
EA2022-91 SIP2022-135 SP2022-55 pp.89-94 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 11:00 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査 ○藤村拓弥・戸田智基(名大) EA2022-112 SIP2022-156 SP2022-76 |
Deep neural network (DNN)音声強調では,一般的にクリーン音声を学習のターゲットとして用いる.しか... [more] |
EA2022-112 SIP2022-156 SP2022-76 pp.221-226 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-17 15:00 |
ONLINE |
オンライン開催 |
群論を用いた声道長変換の表現と解析的正規化処理 ○宮下敦志・戸田智基(名大) SP2022-11 |
音声認識モデルには,話者の違いによる発声の揺らぎに対して認識結果が不変であることが求められる.声道長変換はそのような揺ら... [more] |
SP2022-11 pp.41-46 |
EA |
2022-05-13 14:35 |
ONLINE |
オンライン開催 |
二種の二値分類タスクに基づく外れ値検出を用いた直列型異常音検知法 ○畔栁伊吹(名大)・林 知樹(名大/HDL)・武田一哉・戸田智基(名大) EA2022-8 |
異常音検出システムは,正常時の音データのみを用いて,異常時の音を検出する. 精度の高い異常音検知手法の一つとして,正常デ... [more] |
EA2022-8 pp.35-40 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-01 14:45 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
劣決定条件下での方向情報と条件付き変分自己符号化器に基づく目標話者抽出 ○王 鋭・李 莉・戸田智基(名大) EA2021-76 SIP2021-103 SP2021-61 |
[more] |
EA2021-76 SIP2021-103 SP2021-61 pp.76-81 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]統合型ソースフィルタネットワークによるニューラルボコーダ ○米山怜於・呉 宜樵・戸田智基(名大) EA2020-69 SIP2020-100 SP2020-34 |
本稿では,ソースフィルタ理論に基づくニューラルボコーダを単一のネットワークにより実現する手法を提案する.深層学習に基づく... [more] |
EA2020-69 SIP2020-100 SP2020-34 pp.57-62 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-04 09:00 |
ONLINE |
オンライン開催 |
特徴量空間のクラス重心を考慮した二値分類モデルによる異常音検知 ○畔栁伊吹・林 知樹・武田一哉・戸田智基(名大) EA2020-79 SIP2020-110 SP2020-44 |
異常音検知システムでは,正常データのみを用いて未知の異常音を検知することが必要となる.
一方で,異常音検知システムの運... [more] |
EA2020-79 SIP2020-110 SP2020-44 pp.114-121 |
SP, EA, SIP (共催) |
2020-03-02 09:20 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
複数話者WaveNetボコーダを用いたニューラル話速変換の試み ○岡本拓磨(NICT)・松原圭亮(神戸大/NICT)・戸田智基(名大/NICT)・志賀芳則・河井 恒(NICT) EA2019-101 SIP2019-103 SP2019-50 |
音の高さを変えずに音声を伸縮する話速変換技術は,従来 WSOLA や STRIGHT ボコーダ等の信号処理 により実現さ... [more] |
EA2019-101 SIP2019-103 SP2019-50 pp.1-6 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
CycleVAEを用いたクロスリンガル声質変換 ○中谷 輝・Patrick Lumban Tobing・武田一哉・戸田智基(名大) EA2019-139 SIP2019-141 SP2019-88 |
本報告では,循環型変分自己符号化器(Cyclic Variational Auto-encoder: CycleVAE)... [more] |
EA2019-139 SIP2019-141 SP2019-88 pp.219-224 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧 ○関 翔悟・高田萌絵・武田一哉・戸田智基(名大) EA2019-140 SIP2019-142 SP2019-89 |
自己発声音に対する音声強調・抑圧において,外部雑音に頑健で自己発声音成分を支配的に含む,という特性をもつ体内伝導音を空気... [more] |
EA2019-140 SIP2019-142 SP2019-89 pp.225-230 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2019-12-06 16:25 |
東京 |
NHK放送技術研究所 |
発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価 ○岡田慎太郎(名大)・安藤厚志(名大/NTT)・戸田智基(名大) SP2019-43 |
本稿では,発話感情認識の精度向上に向けて,表現学習およびデータ拡張に基づく感情認識特徴量抽出法を提案する.
表現学習に... [more] |
SP2019-43 pp.91-96 |
SP |
2019-08-28 14:40 |
京都 |
京都大学 |
[ポスター講演]模擬難聴処理を活用した音声波形加工に基づく明瞭度改善 ○彦坂 秀・小林和弘・林 知樹・関 翔悟・武田一哉(名大)・坂野秀樹(名城大)・戸田智基(名大) SP2019-13 |
医学的な治療が困難である感音性難聴は,補聴器による聴覚機能の補助を行うのが一般的である.補聴器では,入力信号に対して周波... [more] |
SP2019-13 pp.25-29 |