講演抄録/キーワード |
講演名 |
2020-03-05 09:20
【6月研究会へ振替】Self-Play深層強化学習を用いた画像の高速非線形リサイズ ○梶浦信勝・小杉 哲・汪 雪婷・山崎俊彦・相澤清晴(東大) IMQ2019-40 IE2019-122 MVE2019-61 |
抄録 |
(和) |
本研究は入力画像を任意のアスペクト比にリサイズする画像リターゲティングについて扱う.従来のマルチオペレータを用いた手法では,オペレータを組み合わせて複数の画像を実際に生成し,入力画像との距離を最小化するオペレータの組み合わせを探索することでリターゲット画像が生成されていた.本研究では,最適なオペレータの組み合わせを高速に探索するために強化学習エージェントにより段階的に適切なオペレータを予測する手法を提案する.本手法の利点はオペレータの数が計算量にあまり影響しない点である.しかしながら,入力画像とリターゲット画像の距離は画像によって大きく異なるため,従来手法の評価関数をそのまま報酬として利用することは困難である.この問題を解決するため,自己対戦による勝敗を報酬として与えることで,評価関数の値の変化を吸収することを提案する.提案手法による実験を行ったところ,従来手法の数万分の1の演算時間での高速なマルチオペレータ画像リターゲティングが可能となった.また,主観評価実験により従来手法と比べ性能差が非有意で同程度のリターゲット結果が得られることが示された. |
(英) |
We address image retargeting, which is a task of adjusting input images into arbitrary sizes. In a previous method, they combine multiple operators and generate multiple retargeted images to find the optimal combination, which minimizes the distance between the original and the retargeted images. In this paper, to find the optimal combination more quickly, we propose a method of predicting the optimal operator step by step using a reinforcement learning agent. The advantage of this method is that it is hardly affected even if the number of operators increases. Since the distance between the input image and the retargeted image varies greatly depending on the image, it is difficult to use the evaluation function of the conventional method as a reward. In order to solve this problem, we propose that a reward based on self-play can be insensitive to changes in the value of the evaluation function. We conduct experiments, which show that our method achieves multi-operator image retargeting that is faster by four orders of magnitude and has the same performance as the previous method. |
キーワード |
(和) |
画像リターゲティング / マルチオペレータ / 深層強化学習 / 自己対戦 / / / / |
(英) |
image retargeting / multi-operator / deep reinforcement learning / self-play / / / / |
文献情報 |
信学技報, vol. 119, no. 457, MVE2019-61, pp. 127-131, 2020年3月. |
資料番号 |
MVE2019-61 |
発行日 |
2020-02-27 (IMQ, IE, MVE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IMQ2019-40 IE2019-122 MVE2019-61 |
|