研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 10:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化 ○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-64 SIP2023-111 SP2023-46 |
高齢者の音声は,一般にスマートスピーカーなどに使用されている音声認識機では一般話者に比べて精度 が低くなってしまう.これ... [more] |
EA2023-64 SIP2023-111 SP2023-46 pp.19-24 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大) EA2023-100 SIP2023-147 SP2023-82 |
音声認識(automatic speech recognition: ASR)は様々なサービスや事業で活用されており,そ... [more] |
EA2023-100 SIP2023-147 SP2023-82 pp.232-237 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
複数音声認識モデルを統合した音声認識システムの高精度化 ○北條圭悟・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-101 SIP2023-148 SP2023-83 |
[more] |
EA2023-101 SIP2023-148 SP2023-83 pp.238-243 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 09:30 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
話者適応による聴覚障害者音声認識の評価 ○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大) EA2023-102 SIP2023-149 SP2023-84 |
健聴者と聴覚障害者とのコミュニケーションには,一般に手話,筆談,音声認識などが用いられる.聴覚障害者の半数以上が音声を用... [more] |
EA2023-102 SIP2023-149 SP2023-84 pp.244-249 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
x-vectorの話者空間を利用した2話者間の中間話者音声合成 ○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大) EA2023-103 SIP2023-150 SP2023-85 |
近年,複数話者の声質や話し方について学習している音声合成器を用いて,学習セットに含まれていな い話者の音声を新たに合成す... [more] |
EA2023-103 SIP2023-150 SP2023-85 pp.250-255 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 ○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) SP2023-12 |
音声認識技術は, 音声認識モデルの精度向上により, さまざまな分野で利用されているが, 学習に用いるデータと認識対象とな... [more] |
SP2023-12 pp.60-64 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 ○塩根凪人・若林佑幸・北岡教英(豊橋技科大) SP2023-22 |
近年では音声認識の技術が進歩しているが,言語情報だけ認識するものが多く,言語・非言語現象を認識できない.そこで本研究は,... [more] |
SP2023-22 pp.109-113 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-11-29 14:35 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Density Ratio Approachに基づく複数Encoder-Decoder音声認識モデル統合手法 ○北條圭悟・森 大輝・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) NLC2022-10 SP2022-30 |
Encoder--Decoder音声認識の性能を改善する手法として音声認識モデルと言語モデルの統合がある.音声認識モデル... [more] |
NLC2022-10 SP2022-30 pp.5-9 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-12-01 15:50 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
大規模音声データのみ獲得できる環境下への音声認識モデルのドメイン適応 ○木内貴浩・森 大輝(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) NLC2022-18 SP2022-38 |
現在,Transformer音声認識モデルなどの高性能なモデルの登場により様々なサービスや事業で音声認識が活用されいる.... [more] |
NLC2022-18 SP2022-38 pp.50-53 |
WIT, SP (共催) IPSJ-SLP (連催) [詳細] |
2020-10-22 14:10 |
ONLINE |
オンライン開催 |
音声言語情報に基づいた認知症高齢者の判別 ○梅澤舞菜・入部百合絵(愛知県立大)・北岡教英(豊橋技科大) SP2020-12 WIT2020-13 |
近年,高齢者の対話音声から軽度認知症者を検出する研究が進められている.本研究でも音声言語情報から認知症に関連する特徴を明... [more] |
SP2020-12 WIT2020-13 pp.21-26 |
PRMU, SP (共催) |
2018-06-29 11:30 |
長野 |
信州大学 |
RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング ○西村良太・檜垣美帆・北岡教英(徳島大) PRMU2018-32 SP2018-12 |
本研究では,近年高い成果をあげ,急速に発展・活用されている機械学習アルゴリズムである深層学習(Deep Learning... [more] |
PRMU2018-32 SP2018-12 pp.59-64 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP (連催) (併催) [詳細] |
2017-12-21 12:50 |
東京 |
早稲田大学グリーン・コンピューティング・システム研究開発センター |
[ポスター講演]発話の分散表現に基づく雑談音声対話システムの応答種別選択 ○太田健吾(阿南高専)・西村良太・北岡教英(徳島大) SP2017-55 |
[more] |
SP2017-55 pp.1-5 |
WIT, SP (共催) |
2017-10-19 14:20 |
福岡 |
九工大戸畑図書館(北九州) |
回想法を指向した事例ベース雑談音声対話システムにおける単語の分散表現を用いたユーザへの事例適応 ○瀬戸栄地・西村良太・北岡教英(徳島大) SP2017-38 WIT2017-34 |
認知症の予防・改善のために自然な雑談対話(回想法)を行う音声対話システムを開発する必要がある.事例ベースの対話システムに... [more] |
SP2017-38 WIT2017-34 pp.23-28 |
SP |
2016-08-24 13:00 |
京都 |
京都大学学術情報メディアセンター |
Deep Neural Networkに基づく日常生活行動認識における適応手法 ○林 知樹(名大)・北岡教英(徳島大)・戸田智基・武田一哉(名大) SP2016-27 |
我々は高齢者が活き活きと自活していけるような生活支援のための見守りシステムの構築を目指しており, そのために必要な技術が... [more] |
SP2016-27 pp.1-6 |
SP |
2015-10-16 11:15 |
兵庫 |
神戸大学 瀧川記念学術交流会館 |
深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識 ○田村哲嗣(岐阜大)・二宮宏史(名大)・北岡教英(徳島大)・大須賀 晋(アイシン精機)・入部百合絵(愛知県立大)・武田一哉(名大)・速水 悟(岐阜大) SP2015-69 |
本稿では,音声と口唇画像を用いるマルチモーダル音声認識において,深層学習によるボトルネック特徴量を用いる手法を提案する.... [more] |
SP2015-69 pp.57-62 |
SP |
2015-08-21 10:50 |
岩手 |
岩手県立大学アイーナキャンパス |
話者交替行為の情報量を用いた話者活性度の評価 ○陳 伯翰(名大)・北岡教英(徳島大)・大武美保子(千葉大)・武田一哉(名大) SP2015-52 |
話者交替の確率モデル化と情報量を用いた話者活性度を評価する手法を提案する。提案法が従来の手法との一致性をもちながら,より... [more] |
SP2015-52 pp.13-17 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]対話者間の音声特徴類似度と対話の情報伝達効果の関係 ○陳 伯翰(名大)・北岡教英(徳島大)・武田一哉(名大) SP2014-124 |
本稿では,対話者間の音声特徴類似度と対話の情報伝達効果の関係を調査する.そのためHCRCマップタスクのデータを利用する.... [more] |
SP2014-124 pp.147-152 |
SP, WIT, ASJ-H (共催) |
2014-06-20 10:25 |
石川 |
近江町交流プラザ |
同時発話の高性能な音声認識 ~ スペクトル減算による分離の高速化と分離音を用いた音響モデル学習 ~ ○出木浦悠人・松本哲也・竹内義則・工藤博章・大西 昇・北岡教英・武田一哉(名大) SP2014-56 WIT2014-11 |
本研究の目的は,同時発話を高性能に音声認識することである.認識のためには音源分離が必要であるが,その過程で生じる音響的な... [more] |
SP2014-56 WIT2014-11 pp.57-62 |