研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
ICSS, IPSJ-SPT (連催) |
2024-03-21 11:45 |
沖縄 |
沖縄科学技術大学院大学(OIST) OISTカンファレンスセンター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Zoom MailのEnd-to-End Encryptionに対する安全性評価 ○白木章伍・五十部孝典(兵庫県立大) ICSS2023-71 |
Zoom MailはZoom Video Communications社が提供するメールサービスである.Github上で... [more] |
ICSS2023-71 pp.17-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 16:35 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価 ○本山智司・植野夏樹・安田昌弘(都立大)・木下裕磨(東海大)・小野順貴(都立大) EA2023-126 SIP2023-173 SP2023-108 |
本研究では,分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする.本稿では初期検討として,ブリンキー... [more] |
EA2023-126 SIP2023-173 SP2023-108 pp.382-387 |
NS, IN (併催) |
2024-03-01 11:10 |
沖縄 |
沖縄コンベンションセンター |
APNを活用する低遅延・低ジッタを実現する5Gネットワークスライシング手法 ○矢島隆汰・金井謙治・中尾彰宏(東大) NS2023-218 |
少子高齢化に伴い労働人口が減少する近未来のためにあらゆるサービスにおいてDXによる省人化・少人化に期待が集まる.特に,情... [more] |
NS2023-218 pp.270-275 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 10:00 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Improvement of Tacotron2 text-to-speech model based on masking operation and positional attention mechanism ○Tong Ma・Daisuke Saito・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-17 SP2023-37 |
[more] |
NLC2023-17 SP2023-37 pp.19-24 |
NS |
2023-10-05 13:50 |
北海道 |
北海道大学 + オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Low Latency and Low Jitter End-to-End Network Slicing Using Vector Packet Processing for Local 5G Mission Critical Study Case ○Muhammad Iqbal・Kenji Kanai・Akihiro Nakao(Univ. of Tokyo) NS2023-91 |
To tackle the latency challenge and fulfill the requirements... [more] |
NS2023-91 pp.111-116 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 ○塩根凪人・若林佑幸・北岡教英(豊橋技科大) SP2023-22 |
近年では音声認識の技術が進歩しているが,言語情報だけ認識するものが多く,言語・非言語現象を認識できない.そこで本研究は,... [more] |
SP2023-22 pp.109-113 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-02-28 09:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
real-time MRIで収録した調音運動に基づくend-to-end音声合成 ○大谷祐人・澤田 隼・大村英史・桂田浩一(東京理科大) EA2022-77 SIP2022-121 SP2022-41 |
real-time MRI (rtMRI)で収録した調音運動に基づいて音声を合成するend-to-end型の深層学習モデ... [more] |
EA2022-77 SIP2022-121 SP2022-41 pp.13-18 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-12-01 15:50 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模音声データのみ獲得できる環境下への音声認識モデルのドメイン適応 ○木内貴浩・森 大輝(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) NLC2022-18 SP2022-38 |
現在,Transformer音声認識モデルなどの高性能なモデルの登場により様々なサービスや事業で音声認識が活用されいる.... [more] |
NLC2022-18 SP2022-38 pp.50-53 |
R |
2022-07-29 13:55 |
北海道 |
北海道名寄市 駅前交流プラザ「よろーな」 大会議室A・B (ハイブリッド開催,主:現地開催,副:オンライン開催) |
A Comparison Study on Image Captioning by VGG and YOLO ○Yan LYU・Qiangfu Zhao・Yong Liu(UoA) R2022-10 |
[more] |
R2022-10 pp.7-12 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-17 15:00 |
ONLINE |
オンライン開催 |
話者特徴量の操作によりシームレスに話者性を制御できるEnd-to-End音声合成方式の検討 ○青谷直樹・原 直・阿部匡伸(岡山大) SP2022-14 |
本報告では,話者固有の声質や平均的な声の高さなどの情報を表現した話者特徴量を補助情報として,シームレスに話者性を制御でき... [more] |
SP2022-14 pp.55-60 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-02 10:20 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Hybrid RNN-T/Attention構造を用いたストリーミング型End-to-End音声認識モデルと内部言語モデル統合の検討 ○森谷崇史・芦原孝典・安藤厚志・佐藤 宏・田中智大・松浦孝平・増村 亮・デルクロア マーク(NTT)・篠崎隆宏(東工大) EA2021-78 SIP2021-105 SP2021-63 |
本研究ではストリーミング音声認識におけるRecurrent neural network-transducer(RNN-... [more] |
EA2021-78 SIP2021-105 SP2021-63 pp.90-95 |
IN, IA (併催) |
2021-12-17 17:40 |
広島 |
広島大学東千田キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ショートペーパー]通信リンクの不均一性が情報指向遅延耐性ネットワークのコンテンツ配送遅延に与える影響 ○嵯峨山 央・大西美知加・松尾涼太郎・大崎博之(関西学院大) IA2021-49 |
近年、ノード間の通信リンクが断続するような環境に対して、情報指向ネットワークの通信パラダイムを取
り入れた、 ICDT... [more] |
IA2021-49 pp.93-96 |
NLC, IPSJ-NL, SP, IPSJ-SLP (連催) (連催) [詳細] |
2021-12-02 14:20 |
ONLINE |
オンライン開催 |
スパース表現を用いたEnd-to-End音声認識システムの検討 ○矢崎礼一郎・大木 真(山梨大) NLC2021-20 SP2021-41 |
本稿では,End-to-End音声認識システムの特徴量にスパース表現の導入を検討した.End-to-Endモデルの台頭に... [more] |
NLC2021-20 SP2021-41 pp.13-16 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-19 09:30 |
ONLINE |
オンライン開催 |
[招待講演]エンドツーエンドニューラルネットワークによる様々な音声処理技術の統一化の試み ○渡部晋治(カーネギーメロン大) SP2021-8 |
本講演では、近年のエンドツーエンドニューラルネットワークによる音声処理の発展について解説を行う。エンドツーエンドニューラ... [more] |
SP2021-8 p.38 |
SP, IPSJ-SLP, IPSJ-MUS (連催) |
2021-06-19 15:00 |
ONLINE |
オンライン開催 |
局所的な句構造の情報を用いたニューラル音声合成 ○海木延佳・サクティ サクリアニ・中村 哲(奈良先端大) SP2021-23 |
自然な韻律をもつ日本語音声を合成するため、局所的な句構造に基づくフレーズ成分を表す韻律記号をend-to-end音声合成... [more] |
SP2021-23 pp.107-112 |