講演抄録/キーワード |
講演名 |
2020-01-23 15:50
[招待講演]マルチモーダル情報処理と知能 ~ マルチモーダルカテゴリゼーション再訪 ~ ○長井隆行(阪大) MVE2019-31 |
抄録 |
(和) |
マルチモーダル情報の処理は、古くから研究されてきた。実際、音声認識や画像認識などパターン認識の分野では、識別のための情報が増えることによって、多くの場合認識精度が向上する。しかしマルチモーダル処理の重要性は、情報を増やすという側面だけではない。その意義は、むしろモダリティ間の予測にある。例えばある物体を見ると、それがどれくらい重く、どれくらい硬いのかを予測することができる。その予測によって、どれくらいの力でつかむべきかを事前に計画可能となる。言語の理解も、こうした予測の基に成立していると考えることができる。「コップ」という音韻列を聞いて、その見た目や重さ、さらには機能を予測することがその言葉の意味理解である。さらにこれは、アフォーダンスとも関係する。こうしたマルチモーダル情報処理は、マルチモーダル生成モデルを用いた教師なし学習で実現することができる。つまり、ロボットが経験によって得るマルチモーダル情報を使って学習することで、予測モデルを発達させ、概念や行動、言語を学習することができる。我々は、こうした人間の知能の基盤としてのマルチモーダル情報の処理(学習)を、マルチモーダルカテゴリゼーションと呼び、そのアルゴリズムやロボットへの応用を進めてきた。本講演では、マルチモーダルカテゴリゼーションを足がかりに、これを発展させた深層生成モデルや、モデルベース強化学習、ワールドモデルといった 最近の学習モデルへの展開、自由エネルギー原理との関係性などについて議論することで、知能の本質に迫りたい。 |
(英) |
(Not available yet) |
キーワード |
(和) |
マルチモーダルカテゴリゼーション / マルチモーダル生成モデル / 予測 / モデルベース強化学習 / ワールドモデル / / / |
(英) |
multimodal categorization / multimodal generative models / prediction / model-base reinforcement learning / world models / / / |
文献情報 |
信学技報, vol. 119, no. 386, MVE2019-31, pp. 81-81, 2020年1月. |
資料番号 |
MVE2019-31 |
発行日 |
2020-01-16 (MVE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
MVE2019-31 |