講演抄録/キーワード |
講演名 |
2023-02-22 13:30
人名を含むイメージキャプショニング手法の検討 ○藤森真綱・望月貴裕(NHK) |
抄録 |
(和) |
我々は、解説放送の自動生成を主な目標として、イメージキャプショニング手法の研究に取り組んでいる。従来のイメージキャプショニング技術では、人物は人名ではなくmanやwoman等の普通名詞で表現されるケースがほとんどである。しかし解説放送では、人名は番組理解のために欠かせない要素であり、人名を記述可能な新しいキャプショニング技術が求められている。そこで我々は、番組に付与されたオープンキャプションおよびクローズドキャプションを利用した、人手によるアノテーション不要な人名推定技術を用いて、人名を含むキャプションを自動生成する手法を検討した。 |
(英) |
We have been working on image captioning techniques with the main goal of automatically generating audio description. In most conventional image captioning techniques, people are represented by common nouns such as "man" or "woman" instead of their names. However, in audio description, the names of people are indispensable for program comprehension, and a new image captioning technique that can describe the names of people is required. Therefore, we investigated a method to automatically generate captions that include people's names using a person name estimation technique that utilizes open and closed captions assigned to programs and does not require human annotation. |
キーワード |
(和) |
イメージキャプショニング / 顔検出 / 顔認識 / クラスタリング / Phrase Grounding / / / |
(英) |
Image Captioning / Face Detection / Face Recognition / Clustering / Phrase Grounding / / / |
文献情報 |
信学技報 |
資料番号 |
|
発行日 |
|
ISSN |
Online edition: ISSN 2432-6380 |
PDFダウンロード |
|