講演抄録/キーワード |
講演名 |
2023-03-02 11:05
メタ学習を用いた単語読唇の検討 ○児玉道成・齊藤剛史(九工大) PRMU2022-77 IBISML2022-84 |
抄録 |
(和) |
視覚情報のみを用いて発話内容を推定する読唇技術は,教師あり学習の一種であり,大規模なデータセットが望まれている.しかし,発話シーンの収集はコストがかかる問題がある.そこで本論文では,収集コストを抑えるために,少数データで学習するアプローチの中で,メタ学習を用いる手法を検討する.読唇用公開データセットLRWおよびSSSD,比較用として行動認識公開データセットUCF101の三つのデータセットを用いて,ProtoNetやDeepBDCなど幾つかのメタ学習手法を用いて認識実験を実施した.その結果,UCF101に比べるとLRWとSSSDでは低い認識精度であった.本稿では実施した実験結果を報告する. |
(英) |
Lip-reading technology, which estimates utterance content using only visual information, is a kind of supervised learning, and a large-scale data set is desired. However, collecting utterance scenes is costly. Therefore, in this paper, in order to reduce the collection cost, we consider a method that uses meta learning in the approach of learning with a small number of data. Recognition experiments were conducted using several meta learning methods such as ProtoNet and DeepBDC using three datasets: public datasets LRW and SSSD for lip-reading, and public action recognition dataset UCF101 for comparison. As a result, compared to UCF101, LRW and SSSD had lower recognition accuracy. In this paper, we report the experimental results. |
キーワード |
(和) |
Few-shot learning / メタ学習 / 読唇 / 単語 / / / / |
(英) |
Few-shot learning / meta learning / lip-reading / word / / / / |
文献情報 |
信学技報, vol. 122, no. 404, PRMU2022-77, pp. 102-106, 2023年3月. |
資料番号 |
PRMU2022-77 |
発行日 |
2023-02-23 (PRMU, IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2022-77 IBISML2022-84 |
研究会情報 |
研究会 |
PRMU IBISML IPSJ-CVIM |
開催期間 |
2023-03-02 - 2023-03-03 |
開催地(和) |
はこだて未来大学 |
開催地(英) |
Future University Hakodate |
テーマ(和) |
異分野連携(PRMU)、AutoML (CVIM)、機械学習の理論と応用の広がり(IBISML) |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2023-03-PRMU-IBISML-CVIM |
本文の言語 |
日本語 |
タイトル(和) |
メタ学習を用いた単語読唇の検討 |
サブタイトル(和) |
|
タイトル(英) |
A Study of Word Lip-Reading using Meta Learning |
サブタイトル(英) |
|
キーワード(1)(和/英) |
Few-shot learning / Few-shot learning |
キーワード(2)(和/英) |
メタ学習 / meta learning |
キーワード(3)(和/英) |
読唇 / lip-reading |
キーワード(4)(和/英) |
単語 / word |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
児玉 道成 / Michinari Kodama / コダマ ミチナリ |
第1著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech) |
第2著者 氏名(和/英/ヨミ) |
齊藤 剛史 / Takeshi Saitoh / サイトウ タケシ |
第2著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-03-02 11:05:00 |
発表時間 |
10分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2022-77, IBISML2022-84 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.404(PRMU), no.405(IBISML) |
ページ範囲 |
pp.102-106 |
ページ数 |
5 |
発行日 |
2023-02-23 (PRMU, IBISML) |
|