研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIS |
2024-03-14 14:00 |
神奈川 |
神奈川工科大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数人対話環境における発話推定の学習データの分割数及び組み合わせに関する考察 ○上村海斗・堀尾恵一(九工大) SIS2023-48 |
今日,会議・ニュース・電話音声などを主な対象として話者ダイアライゼーションと呼ばれる発話区間検出技術の重要性が増してきて... [more] |
SIS2023-48 pp.17-20 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:10 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換 ○五十嵐琢斗・齋藤佑樹・関 健太郎・高道慎之介(東大)・山本龍一・橘 健太郎(LY)・猿渡 洋(東大) EA2023-63 SIP2023-110 SP2023-45 |
本稿では,ノイジーな入力音声に対し,その音声品質と音響環境を表現する潜在変数の条件付けを行うノイズロバストな音声変換を提... [more] |
EA2023-63 SIP2023-110 SP2023-45 pp.13-18 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2023-10-14 16:40 |
福岡 |
九州工業大学(戸畑キャンパス) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Sequence-to-sequence Voice Conversion for Electrolaryngeal Speech Enhancement with Multi-stage Pretraining and Fine-tuning Techniques ○Ding Ma・Lester Phillip Violeta・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) SP2023-32 WIT2023-23 |
Sequence-to-sequence (seq2seq) voice conversion (VC) models ... [more] |
SP2023-32 WIT2023-23 pp.27-32 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
深層学習を用いたアカペラ歌声分離における歌声合成による教師データ拡張の検討 ○風間香伽(都立大)・木下裕磨(東海大)・植野夏樹・小野順貴(都立大) SP2023-4 |
本研究では,深層学習を用いたアカペラ歌声分離に有効な教師データを検討する.アカペラや合唱など楽器を用いない歌唱データセッ... [more] |
SP2023-4 pp.14-19 |
PRMU, IBISML (共催) IPSJ-CVIM (連催) [詳細] |
2023-03-03 16:50 |
北海道 |
はこだて未来大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
歌唱音素列の知覚的損失を考慮したCycleGANによるノンパラレルデータ日本語歌い手変換 ○玄元 奏・島田伸敬・松尾直志(立命館大) PRMU2022-114 IBISML2022-121 |
本論文ではパラレルデータを必要としない一対一の日本語歌声変換手法を提案する.
提案手法はCycleGANに基づくスペク... [more] |
PRMU2022-114 IBISML2022-121 pp.293-298 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 10:40 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換 ○岸田拓也・中鹿 亘(電通大) EA2022-107 SIP2022-151 SP2022-71 |
本研究では,変換目標と変換元の音声の発話内容を揃えたパラレルデータセットで学習した拡散確率モデルをベースとする声質変換手... [more] |
EA2022-107 SIP2022-151 SP2022-71 pp.191-196 |
EA, US (併催) |
2022-12-22 16:50 |
広島 |
サテライトキャンパスひろしま |
[ポスター講演]機械学習を用いた音声処理に向けたデータ拡張手法の研究 ○丸山 翼(東工大)・池上 努(産総研)・遠藤敏夫(東工大)・広渕崇宏(産総研) EA2022-68 |
機械学習において,学習データに変換を加えてデータの数と多様性を強化し,過学習を抑制する手法にデータ拡張がある.人間の発話... [more] |
EA2022-68 pp.42-48 |
NS, SR, RCS, SeMI, RCC (併催) |
2022-07-13 14:50 |
石川 |
金沢歌劇座 + オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
U-Netを用いた雑音除去と音声認識性能向上の検討 ~ 電車走行雑音を対象として ~ ○林 堅・佐野将太・川喜田佑介・宮崎 剛・田中 博(神奈川工科大) SeMI2022-26 |
雑音を含んだ音声を画像に変換し,雑音を除去する方法が提案されている.筆者らは電車内のアナウンスを聴覚に障害を持つ人に伝達... [more] |
SeMI2022-26 pp.34-39 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-04 17:10 |
ONLINE |
オンライン開催 |
事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換 ○越塚 毅・大村英史・桂田浩一(東京理科大) EA2020-89 SIP2020-120 SP2020-54 |
音声変換は,入力された音声に対して言語情報を保持しつつ,話者性などの非言語情報のみを変換する技術である.一般的に,音声か... [more] |
EA2020-89 SIP2020-120 SP2020-54 pp.176-181 |
EA, ASJ-H, EMM (共催) |
2020-11-20 09:00 |
ONLINE |
オンライン開催 |
[ポスター講演]防災放送のためのボイストレーニングシステムの構築 ○蛇澤恵太・高野佐代子・土田義郎(金沢工大) EA2020-22 EMM2020-37 |
我々は一般人の防災放送アナウンスのための効果的なトレーニングシステムの実現をめざしている。本報告では、トレーニングに際し... [more] |
EA2020-22 EMM2020-37 pp.6-8 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
模擬難聴システムWHISを用いた発声訓練音声の発声特徴量と聴覚特徴量 ○東山宗一・吉木華子・河原英紀・入野俊夫(和歌山大) EA2019-113 SIP2019-115 SP2019-62 |
本研究では, 模擬難聴システムを用いた発声訓練による明瞭性変化と特徴量変化の関係について調査した. 発声された音声の特徴... [more] |
EA2019-113 SIP2019-115 SP2019-62 pp.71-76 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
朗読音声を用いたノンパラレル声質変換による変換音声の話者性と表現の評価 ○永瀬亮太郎・井本桂右・山西良典・山下洋一(立命館大) EA2019-138 SIP2019-140 SP2019-87 |
現在の声質変換の技術において, 感情や抑揚,間の取り方などの多様な表現の再現は課題の1つとして研究されている.しかしなが... [more] |
EA2019-138 SIP2019-140 SP2019-87 pp.213-218 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
CycleVAEを用いたクロスリンガル声質変換 ○中谷 輝・Patrick Lumban Tobing・武田一哉・戸田智基(名大) EA2019-139 SIP2019-141 SP2019-88 |
本報告では,循環型変分自己符号化器(Cyclic Variational Auto-encoder: CycleVAE)... [more] |
EA2019-139 SIP2019-141 SP2019-88 pp.219-224 |
HIP, ASJ-H (共催) |
2020-02-16 12:40 |
沖縄 |
琉球大学医学部 |
バーチャルリアリティを用いた一次救命処置訓練システムの開発 ○渡辺皓太(早大)・神長伸幸(ミイダス)・菊池英明(早大) HIP2019-91 |
本研究では,バーチャルリアリティ環境で一次救命処置訓練ができるシステムを開発した.本システ ムの特徴は,ユーザの発話音声... [more] |
HIP2019-91 pp.73-78 |
ICD, CPSY, CAS (共催) |
2018-12-23 13:20 |
沖縄 |
ホテルアトールエメラルド宮古島 |
VR商店街アプリにおける言語の入力方法に関する検討 ○河崎正義・橘 俊宏・長澤可也(湘南工科大) CAS2018-108 ICD2018-92 CPSY2018-74 |
近年,仮想現実(VR)に関連する技術は,様々な分野で活用が期待されている技術の 1 つとなっている. 特に,VR ヘッド... [more] |
CAS2018-108 ICD2018-92 CPSY2018-74 pp.115-118 |
SIS, ITE-BCT (連催) |
2018-10-25 15:40 |
京都 |
京都大学 百周年時計台記念館 |
[チュートリアル講演]ユーザーフレンドリーな機器操作向け音声インターフェースの開発とその応用 ○早坂 昇(阪電通大) SIS2018-15 |
スマートスピーカーやスマートフォンにおける音声認識は,ネットワーク接続が必要となり,データ通信量が増大することやネットワ... [more] |
SIS2018-15 pp.57-62 |
SP |
2018-08-27 11:35 |
京都 |
京都大学 |
[ポスター講演]GANによる音声を対象とした感情変換の実験的評価 ○安田研二・折原良平・清 雄一・田原康之・大須賀昭彦(電通大) SP2018-26 |
ドメイン変換タスクは深層学習の発展によって,より自然で高精度な出力を生成することを可能としている.特にGAN(Gener... [more] |
SP2018-26 pp.19-22 |
WIT |
2018-06-09 16:00 |
神奈川 |
鶴見大学(横浜) |
汎用コミュニケーション支援WebシステムVCANの利用状況分析 ○杉山陽菜子・林 豊彦・入山満恵子(新潟大)・藤川成康・川辺 諭・後藤 崇(銀座堂) WIT2018-5 |
音声出力コミュニケーションエイド(VOCA)は,言語発達障がい児のコミュニケーション支援機器のひとつである.我々の研究チ... [more] |
WIT2018-5 pp.21-26 |
SIP, EA, SP (共催) MI (併催) [詳細] |
2018-03-20 14:45 |
沖縄 |
石垣島 ホテルミヤヒラ |
Development of NU non-parallel Voice Conversion System 2018 ○Yi-Chiao Wu・Patrick Lumban Tobing・Tomoki Hayashi・Kazuhiro Kobayashi・Tomoki Toda(Nagoya Univ.) EA2017-172 SIP2017-181 SP2017-155 |
This paper introduces the NU non-parallel voice conversion (... [more] |
EA2017-172 SIP2017-181 SP2017-155 pp.385-390 |
SP, ASJ-H (共催) |
2018-01-20 13:50 |
東京 |
東京大学 |
複数のネットワークの出力を考慮したDNNベース声質変換手法 ○藤岡拓也・孫 慶華(日立) SP2017-68 |
従来の統計ベース声質変換手法は,ソース話者・ターゲット話者音声パラメータ対の関係を全てのフレームについて単一のモデルによ... [more] |
SP2017-68 pp.11-15 |