お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2023-03-02 11:05
メタ学習を用いた単語読唇の検討
児玉道成齊藤剛史九工大PRMU2022-77 IBISML2022-84
抄録 (和) 視覚情報のみを用いて発話内容を推定する読唇技術は,教師あり学習の一種であり,大規模なデータセットが望まれている.しかし,発話シーンの収集はコストがかかる問題がある.そこで本論文では,収集コストを抑えるために,少数データで学習するアプローチの中で,メタ学習を用いる手法を検討する.読唇用公開データセットLRWおよびSSSD,比較用として行動認識公開データセットUCF101の三つのデータセットを用いて,ProtoNetやDeepBDCなど幾つかのメタ学習手法を用いて認識実験を実施した.その結果,UCF101に比べるとLRWとSSSDでは低い認識精度であった.本稿では実施した実験結果を報告する. 
(英) Lip-reading technology, which estimates utterance content using only visual information, is a kind of supervised learning, and a large-scale data set is desired. However, collecting utterance scenes is costly. Therefore, in this paper, in order to reduce the collection cost, we consider a method that uses meta learning in the approach of learning with a small number of data. Recognition experiments were conducted using several meta learning methods such as ProtoNet and DeepBDC using three datasets: public datasets LRW and SSSD for lip-reading, and public action recognition dataset UCF101 for comparison. As a result, compared to UCF101, LRW and SSSD had lower recognition accuracy. In this paper, we report the experimental results.
キーワード (和) Few-shot learning / メタ学習 / 読唇 / 単語 / / / /  
(英) Few-shot learning / meta learning / lip-reading / word / / / /  
文献情報 信学技報, vol. 122, no. 404, PRMU2022-77, pp. 102-106, 2023年3月.
資料番号 PRMU2022-77 
発行日 2023-02-23 (PRMU, IBISML) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード PRMU2022-77 IBISML2022-84

研究会情報
研究会 PRMU IBISML IPSJ-CVIM  
開催期間 2023-03-02 - 2023-03-03 
開催地(和) はこだて未来大学 
開催地(英) Future University Hakodate 
テーマ(和) 異分野連携(PRMU)、AutoML (CVIM)、機械学習の理論と応用の広がり(IBISML) 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2023-03-PRMU-IBISML-CVIM 
本文の言語 日本語 
タイトル(和) メタ学習を用いた単語読唇の検討 
サブタイトル(和)  
タイトル(英) A Study of Word Lip-Reading using Meta Learning 
サブタイトル(英)  
キーワード(1)(和/英) Few-shot learning / Few-shot learning  
キーワード(2)(和/英) メタ学習 / meta learning  
キーワード(3)(和/英) 読唇 / lip-reading  
キーワード(4)(和/英) 単語 / word  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 児玉 道成 / Michinari Kodama / コダマ ミチナリ
第1著者 所属(和/英) 九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech)
第2著者 氏名(和/英/ヨミ) 齊藤 剛史 / Takeshi Saitoh / サイトウ タケシ
第2著者 所属(和/英) 九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2023-03-02 11:05:00 
発表時間 10分 
申込先研究会 PRMU 
資料番号 PRMU2022-77, IBISML2022-84 
巻番号(vol) vol.122 
号番号(no) no.404(PRMU), no.405(IBISML) 
ページ範囲 pp.102-106 
ページ数
発行日 2023-02-23 (PRMU, IBISML) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会