講演抄録/キーワード |
講演名 |
2021-10-22 13:10
注視対象への文脈を考慮した深層学習による視線移動予測モデル ○大澤祐平・小濱 剛(近畿大) HIP2021-43 |
抄録 |
(和) |
ヒトの視線は,意識や注意といった内的状態が反映された生体信号であることから,視線を予測する技術を応用することで,ヒトの心理を推し量る技術の開発も可能であると考えられる.本研究では,構成論的アプローチに基づいて,ヒトの視線移動の再現が可能な深層学習モデルの構築を目的とする.はじめに,既存の学習モデルを用いて,典型的な画像分類モデルのエンコーダ部により,画像統計量から人の視線移動を決定づける特徴量が抽出可能かどうかを検証した.次に,このエンコーダ部にRNN機構を組み合わせた Seq2Seq 型構造の深層学習モデルにより,注視対象への文脈を有する時系列生成モデルを構築し,静止画像に対する視線移動の再現を行った.モデル
評価のため,実際の視線データおよびモデル出力から生成した累積視線分布間で相互相関係数を算出したところ,全検証データの平均値は 0.459 であった.僅かではあるが正の相関が確認されたこと,画像内で注意を惹きつけやすいオブジェクトや特徴に対して時間的な視線の遷移が確認されたことから,提案モデルによって,少なくとも画像統計量と視線遷移の時間特性との紐付けが可能であることが示唆された. |
(英) |
Since the human gaze is a biological signal which reflects internal states such as consciousness and attention, it is possible to develop technology for estimating human psychology by a gaze predicting system. In this study, we built a deep learning model that can reproduce human eye movement based on a constructive approach. First, we verified whether the encoder part of a typical image classification model could extract features that determine human eye movements from image statistics using a previous learning model. Next, we developed a deep learning model with a Seq2Seq structure that combines the encoder part of a typical image classification model with an RNN mechanism to construct a time series generation model with the context among objects and reproduced eye movements for still images. In order to evaluate the model performance, we calculated the cross-correlation coefficient between cumulative eye gaze distributions generated from the actual eye movements and the model outputs, and the average value for all validation data was 0.459. Since a small but positive correlation was found and temporal eye transitions were observed for objects and features that are likely to attract attention in the image, the proposed model can at least link image statistics with temporal characteristics of eye movements. |
キーワード |
(和) |
視覚系 / 深層学習モデル / 視線予測 / スキャンパス / / / / |
(英) |
Visual system / Deep learning model / Gaze prediction / Scanpath / / / / |
文献情報 |
信学技報, vol. 121, no. 211, HIP2021-43, pp. 69-74, 2021年10月. |
資料番号 |
HIP2021-43 |
発行日 |
2021-10-14 (HIP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HIP2021-43 |