研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討 ○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT) EA2023-105 SIP2023-152 SP2023-87 |
近年,音声認識AIの適用範囲が広がり,日々様々なデータが取得可能になっている.実用上,一つの音声認識モデルを逐次手に入る... [more] |
EA2023-105 SIP2023-152 SP2023-87 pp.262-267 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 09:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction ○Jiajun He・Zekun Yang・Tomoki Toda(名大) NLC2023-16 SP2023-36 |
Automatic speech recognition (ASR) systems often suffer from... [more] |
NLC2023-16 SP2023-36 pp.13-18 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 11:05 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]Enhancing Multi-Accent Automated Speech Recognition with Accent-Activated Adapters ○Yuqin Lin・Longbiao Wang・Jianwu Dang(Tianjin Univ. & Univ. of Tokyo)・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-18 SP2023-38 |
This paper proposes the Accent-Activated adapter (AccentAct)... [more] |
NLC2023-18 SP2023-38 pp.25-30 |
SP, NLC (共催) IPSJ-SLP, IPSJ-NL (共催) (連催) [詳細] |
2023-12-03 11:05 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]Enhancing Dysarthric Speech Recognition with Auxiliary Feature Fusion Module: Exploring Articulatory-related Features from Foundation Models ○Yuqin Lin・Longbiao Wang・Jianwu Dang(Tianjin Univ. & Univ. of Tokyo)・Nobuaki Minematsu(Univ. of Tokyo) NLC2023-19 SP2023-39 |
Addressing dysarthric speech variability in Automatic Speech... [more] |
NLC2023-19 SP2023-39 pp.31-36 |
ET |
2023-10-21 15:30 |
長野 |
信州大学工学部 |
生成系AIと初級外国語学習者のCode Switching発話「聴取」パフォーマンス ○砂岡和子(早大)・徐 勤(京大) ET2023-23 |
教員が日本語と中国語をCode-switching(CS)する初級中国語の授業発話を,Whisperモデルを用いて自動認... [more] |
ET2023-23 pp.33-37 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 ○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) SP2023-11 |
従来の音声認識による自動字幕生成システムでは,発話に含まれる感情などのパラ言語情報を考慮していないため,皮肉表現や多義語... [more] |
SP2023-11 pp.54-59 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 ○塩根凪人・若林佑幸・北岡教英(豊橋技科大) SP2023-22 |
近年では音声認識の技術が進歩しているが,言語情報だけ認識するものが多く,言語・非言語現象を認識できない.そこで本研究は,... [more] |
SP2023-22 pp.109-113 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 10:10 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
日本語音声認識における語彙集合分割とマルチタスク学習による目的語彙抽出 ○伊藤 葵(LINE/法政大)・小松達也・藤田雄介(LINE) EA2022-102 SIP2022-146 SP2022-66 |
本稿は日本語音声認識モデルの語彙集合分割とマルチタスク学習による目的語彙抽出法を提案する.提案手法では, ある語彙集合の... [more] |
EA2022-102 SIP2022-146 SP2022-66 pp.159-164 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-11-30 15:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声合成と音声認識に対するテキストデータを用いた半教師あり統合学習 ○牧島直輝・鈴木聡志・安藤厚志・増村 亮(NTT) NLC2022-14 SP2022-34 |
本稿では,音声合成と音声認識をテキストと音声の少規模ペアデータ及び大規模なテキストデータで学習する新しい学習手法を提案す... [more] |
NLC2022-14 SP2022-34 pp.27-32 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-12-01 14:50 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
A Japanese Automatic Speech Recognition System on the Next-Gen Kaldi Framework ○Wen Shen Teo・Yasuhiro Minami(UEC) NLC2022-16 SP2022-36 |
次世代Kaldiと呼ばれる最先端の音声処理ツールキットがKaldiの後継モデルとして2021年に利用されるようになった。... [more] |
NLC2022-16 SP2022-36 pp.39-44 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2022-06-17 15:00 |
ONLINE |
オンライン開催 |
群論を用いた声道長変換の表現と解析的正規化処理 ○宮下敦志・戸田智基(名大) SP2022-11 |
音声認識モデルには,話者の違いによる発声の揺らぎに対して認識結果が不変であることが求められる.声道長変換はそのような揺ら... [more] |
SP2022-11 pp.41-46 |
SIP, BioX, IE, MI (共催) ITE-IST, ITE-ME (共催) (連催) [詳細] |
2022-05-20 11:30 |
熊本 |
熊本大学工学部黒髪キャンパス南地区 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Implementation of a Lightweight Automatic Speech Recognition System at the Edge ○Haotian Tan・Junichi Akita(Kanazawa Univ.) |
[more] |
|
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
時間反転音声を用いた音声認識のためのデータ拡張 ~ 特徴量系列における反転 ~ ○芦原孝典・田中智大・森谷崇史・増村 亮・篠原雄介・柏野牧夫(NTT) EA2019-110 SIP2019-112 SP2019-59 |
音声認識システムにおいて,学習データの音響的な網羅性を可能な限り担保し,過学習を防ぐ事を目的としたアプローチの一つに d... [more] |
EA2019-110 SIP2019-112 SP2019-59 pp.53-58 |
SP, EA, SIP (共催) |
2020-03-02 15:45 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
音声認識におけるEncoder-Decoderモデルの注意重みを用いたCTCモデルへの知識蒸留の評価 ○森谷崇史・佐藤 宏・田中智大・芦原孝典・増村 亮・篠原雄介(NTT) EA2019-131 SIP2019-133 SP2019-80 |
本研究ではConnectionist Temporal Classification(CTC)ベースの音声認識システムの... [more] |
EA2019-131 SIP2019-133 SP2019-80 pp.175-180 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
[ポスター講演]日本人による英語自然発声を対象とした流暢さの高精度自動スコアリングの実現 ○安ヵ川彩乃・安藤慎太郎・紺野瑛介・林 振超・井上雄介・齋藤大輔・峯松信明(東大)・斉藤一弥(Univ. Coll. London) EA2019-134 SIP2019-136 SP2019-83 |
世界的にアイデンティティや多様性が重視されるようになり, 語学のスピーキング教育においてもネイティブらしい発音より伝わり... [more] |
EA2019-134 SIP2019-136 SP2019-83 pp.189-194 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
[ポスター講演]音素セット縮小に用いる言語モデル比較 ○古明地秀治・田中聡久(東京農工大)・篠田浩一(東工大) EA2019-152 SIP2019-154 SP2019-101 |
音素セット縮小に用いる言語モデルを比較する.
音素セット縮小は,学習データが少なく全音素の学習が難しいタスクにおいて,... [more] |
EA2019-152 SIP2019-154 SP2019-101 pp.295-300 |
EA, SIP, SP (共催) |
2019-03-15 10:25 |
長崎 |
アイランド ナガサキ(長崎市) |
条件付き階層再帰型エンコーダデコーダに基づく複数人会話音声認識向け言語モデル ○増村 亮・田中智大・安藤厚志・大庭隆伸・青野裕司(NTT) EA2018-131 SIP2018-137 SP2018-93 |
本稿では,会話に登場する各話者の役割が明確な複数人会話(ロールプレイ会話) 向けの新たな言語モデルを提案する.提案手法の... [more] |
EA2018-131 SIP2018-137 SP2018-93 pp.191-196 |
EA, SIP, SP (共催) |
2019-03-15 13:30 |
長崎 |
アイランド ナガサキ(長崎市) |
[ポスター講演]言語モデルに基づく音素セット縮小 ○古明地秀治・田中聡久(東京農工大) EA2018-134 SIP2018-140 SP2018-96 |
言語モデルに基づく音素セット縮小方法を提案する.音素セットの縮小は,学習データが少なく全音素の学習が難しいタスクにおいて... [more] |
EA2018-134 SIP2018-140 SP2018-96 pp.205-210 |