研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
ICSS, IPSJ-SPT (連催) |
2024-03-21 11:45 |
沖縄 |
沖縄科学技術大学院大学(OIST) OISTカンファレンスセンター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Zoom MailのEnd-to-End Encryptionに対する安全性評価 ○白木章伍・五十部孝典(兵庫県立大) ICSS2023-71 |
Zoom MailはZoom Video Communications社が提供するメールサービスである.Github上で... [more] |
ICSS2023-71 pp.17-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 10:00 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Improvement of Tacotron2 text-to-speech model based on masking operation and positional attention mechanism ○Tong Ma・Daisuke Saito・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-17 SP2023-37 |
[more] |
NLC2023-17 SP2023-37 pp.19-24 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 ○塩根凪人・若林佑幸・北岡教英(豊橋技科大) SP2023-22 |
近年では音声認識の技術が進歩しているが,言語情報だけ認識するものが多く,言語・非言語現象を認識できない.そこで本研究は,... [more] |
SP2023-22 pp.109-113 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
real-time MRIで収録した調音運動に基づくend-to-end音声合成 ○大谷祐人・澤田 隼・大村英史・桂田浩一(東京理科大) EA2022-77 SIP2022-121 SP2022-41 |
real-time MRI (rtMRI)で収録した調音運動に基づいて音声を合成するend-to-end型の深層学習モデ... [more] |
EA2022-77 SIP2022-121 SP2022-41 pp.13-18 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-12-01 15:50 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模音声データのみ獲得できる環境下への音声認識モデルのドメイン適応 ○木内貴浩・森 大輝(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) NLC2022-18 SP2022-38 |
現在,Transformer音声認識モデルなどの高性能なモデルの登場により様々なサービスや事業で音声認識が活用されいる.... [more] |
NLC2022-18 SP2022-38 pp.50-53 |
R |
2022-07-29 13:55 |
北海道 |
北海道名寄市 駅前交流プラザ「よろーな」 大会議室A・B (ハイブリッド開催,主:現地開催,副:オンライン開催) |
A Comparison Study on Image Captioning by VGG and YOLO ○Yan LYU・Qiangfu Zhao・Yong Liu(UoA) R2022-10 |
[more] |
R2022-10 pp.7-12 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-02 10:20 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Hybrid RNN-T/Attention構造を用いたストリーミング型End-to-End音声認識モデルと内部言語モデル統合の検討 ○森谷崇史・芦原孝典・安藤厚志・佐藤 宏・田中智大・松浦孝平・増村 亮・デルクロア マーク(NTT)・篠崎隆宏(東工大) EA2021-78 SIP2021-105 SP2021-63 |
本研究ではストリーミング音声認識におけるRecurrent neural network-transducer(RNN-... [more] |
EA2021-78 SIP2021-105 SP2021-63 pp.90-95 |
IN, IA (併催) |
2021-12-17 17:40 |
広島 |
広島大学東千田キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ショートペーパー]通信リンクの不均一性が情報指向遅延耐性ネットワークのコンテンツ配送遅延に与える影響 ○嵯峨山 央・大西美知加・松尾涼太郎・大崎博之(関西学院大) IA2021-49 |
近年、ノード間の通信リンクが断続するような環境に対して、情報指向ネットワークの通信パラダイムを取
り入れた、 ICDT... [more] |
IA2021-49 pp.93-96 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-19 15:00 |
ONLINE |
オンライン開催 |
局所的な句構造の情報を用いたニューラル音声合成 ○海木延佳・サクティ サクリアニ・中村 哲(奈良先端大) SP2021-23 |
自然な韻律をもつ日本語音声を合成するため、局所的な句構造に基づくフレーズ成分を表す韻律記号をend-to-end音声合成... [more] |
SP2021-23 pp.107-112 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 14:05 |
ONLINE |
オンライン開催 |
[ポスター講演]大規模言語モデルによる未観測文の生成機構を持つEnd-to-Endインクリメンタル音声合成 ○佐伯高明・高道慎之介・猿渡 洋(東大) EA2020-74 SIP2020-105 SP2020-39 |
テキスト音声合成 (text-to-speech: TTS) は,テキスト情報から人間の発話音声を人工的に合成する技術で... [more] |
EA2020-74 SIP2020-105 SP2020-39 pp.85-90 |
EA, SP, SIP (共催) US, IPSJ-SLP (連催) (連催) ※学会内は併催 [詳細] |
2021-03-03 17:35 |
ONLINE |
オンライン開催 |
[ショートペーパー]Comparison of End-to-End Models for Joint Speaker and Speech Recognition ○Kak Soky(Kyoto Univ.)・Sheng Li(NICT)・Masato Mimura・Chenhui Chu・Tatsuya Kawahara(Kyoto Univ.) EA2020-78 SIP2020-109 SP2020-43 |
In this paper, we investigate the effectiveness of using spe... [more] |
EA2020-78 SIP2020-109 SP2020-43 pp.109-113 |
NLC, IPSJ-NL, SP, IPSJ-SLP (連催) (連催) [詳細] |
2020-12-02 09:40 |
ONLINE |
オンライン開催 |
CTCとマスク推定に基づく推論速度の速いEnd-to-End音声認識 ○樋口陽祐(早大)・稲熊寛文(京大)・渡部晋治(JHU)・小川哲司・小林哲則(早大) NLC2020-13 SP2020-16 |
Connectionist Temporal Classification (CTC)とマスク推定により非自己回帰的なE... [more] |
NLC2020-13 SP2020-16 pp.1-6 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2020-10-22 13:00 |
ONLINE |
オンライン開催 |
[招待講演]日本語End-to-End 音声合成に対するNHKの取り組み ○栗原 清(NHK) SP2020-11 WIT2020-12 |
放送事業者であるNHKは,番組を制作し,それを放送することを主な業務としている.毎日,多くの番組を制作する中で,音声コン... [more] |
SP2020-11 WIT2020-12 pp.19-20 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
時間反転音声を用いた音声認識のためのデータ拡張 ~ 特徴量系列における反転 ~ ○芦原孝典・田中智大・森谷崇史・増村 亮・篠原雄介・柏野牧夫(NTT) EA2019-110 SIP2019-112 SP2019-59 |
音声認識システムにおいて,学習データの音響的な網羅性を可能な限り担保し,過学習を防ぐ事を目的としたアプローチの一つに d... [more] |
EA2019-110 SIP2019-112 SP2019-59 pp.53-58 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
[ポスター講演]日本語end-to-end音声合成を用いた韻律シンボル教示とその音響的実現に関する音声教育的考察 ○吉澤風希(東大)・熊野 正(NHK)・峯松信明(東大)・栗原 清(NHK) EA2019-137 SIP2019-139 SP2019-86 |
日本語教育における韻律シンボル教示の効果を検討するために、end-to-end音声合成システムの学習プロセスを人間の学習... [more] |
EA2019-137 SIP2019-139 SP2019-86 pp.207-212 |