講演抄録/キーワード |
講演名 |
2012-03-30 14:40
読唇に有効な顔モデルの検討 ○齊藤剛史・韓 リャン(九工大) PRMU2011-275 HIP2011-103 |
抄録 |
(和) |
読唇に関する研究は随所で取り組まれているが,読唇に用いる顔モデルに関する検討はなされていない.本論文では,顔部位の組み合わせに基づく顔モデルおよび口唇輪郭や口唇特徴点を変更した20個の顔モデルを構築する.モデル形状のみを変更し,その他のアルゴリズムを変更せずに認識実験を実施し,モデル形状と認識精度を解析することにより,読唇に有効な顔モデルを検討する.モデル構築にはActive Appearance Modelを利用する.認識実験には英数字10単語の発話シーンが含まれているCUAVEデータベースを利用した.その結果,口唇以外の顔部位を含めず,口唇のみを用いた顔モデルが最も高い認識精度を得られることが判明した.また口唇に関しては外側唇輪郭と内側唇輪郭の両方をモデルに含め,口唇特徴点が多いモデルが高い認識率を得られやすい知見を得た. |
(英) |
There is number of researches on the lip reading. However, there is little discussion about which face shape is effect for lip reading. This paper builds 20 face models which changes the combination of a face part, and changes the feature points. Various experiments were conducted on the conditions which change only model and do not change other algorithms. We apply the Active Appearance Model. The CUAVE database which the utterance scene of ten numerical words is contained was used for the recognition experiment. As a result, the model only lips acquired the highest recognition accuracy. We found both the outer lip contour and the inner lip contour were included in the model, and the model with many feature points can be easy to obtain the high recognition accuracy. |
キーワード |
(和) |
読唇 / 顔モデル / Active Appearance Model / / / / / |
(英) |
lip reading / face model / Active Appearance Model / / / / / |
文献情報 |
信学技報, vol. 111, no. 499, PRMU2011-275, pp. 217-222, 2012年3月. |
資料番号 |
PRMU2011-275 |
発行日 |
2012-03-22 (PRMU, HIP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2011-275 HIP2011-103 |