講演抄録/キーワード |
講演名 |
2023-09-12 15:55
音声と3DMMに基づくマスクを除去した顔画像の推定 ○赤塚哲丸・折原良平・清 雄一・田原康之・大須賀昭彦(電通大) AI2023-32 |
抄録 |
(和) |
COVID-19の流行によりマスクの着用が一般的となったが, 顔の半分近くを覆うマスクは, セキュリティや識別システムに影響を及ぼし始めている. この課題に対応する為, 高精度な顔推定技術が求められている. 現在の最先端手法は, 3D Morphable Model(3DMM)を中間表現とし, 顔テクスチャの復元品質の向上には成功しているが, 顔形状の復元性能については不十分であり, 生成された顔の一部はアイデンティティが著しく損なわれている. 本研究では, マスクで隠れてしまう口や鼻の形状と特に相関の高い音声に着目し, 顔形状の推定に3DMMと音声を用いたマルチモーダルな手法を提案する. 実験の結果, 提案手法は音声を考慮しないベースライン手法と比較して, 定性的・定量的に品質が向上することが示された. |
(英) |
Facemasks have become common due to the COVID-19 pandemic. They have begun to affect security and identification systems because they cover almost half of the face. Current state-of-the-art methods have been applied to estimate unmasked faces from masked face images. They are successful in improving the quality of the face texture by 3D Morphable Model (3DMM) as intermediate representations. However, their performance in restoring the face shapes is insufficient, and some of generated faces lack identities. In this study, we focus on voice, which has a particularly high correlation with the shape of the mouth and nose, which are obscured by masks. We propose a multimodal method using 3DMM and voice for face shape estimation under masks. Experimental results show that the proposed method qualitatively and quantitatively improves the quality of shape restoration of a face compared to the baseline method without considering voice. |
キーワード |
(和) |
マスク除去 / Inpainting / 3DMM / 音声埋め込み / マルチモーダル / / / |
(英) |
Mask Removal / Inpainting / 3DMM / Voice Embedding / Multimodal / / / |
文献情報 |
信学技報, vol. 123, no. 190, AI2023-32, pp. 187-193, 2023年9月. |
資料番号 |
AI2023-32 |
発行日 |
2023-09-05 (AI) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2023-32 |
|