講演抄録/キーワード |
講演名 |
2018-03-13 17:05
話速変換会話における音声への映像同期の効果 ○小山内一樹・徳永弘子・武川直樹・斎藤博人(東京電機大) HCS2017-105 |
抄録 |
(和) |
話速変換とは,音声の高さを保ったまま速度を変える技術である.この技術を,コミュニケーション支援を目的に,遠隔地間の映像会話に適用したものが話速変換会話システムである.これまでの話速変換会話システムでは,音声はゆっくりに変換されるが,映像はリアルタイムに伝送していた.その結果,話し手の視線行動等の発話に付随する非言語行動が音声と同期しなくなり,聞き手が受ける次話者指定の強度が低下し,順番交替のしにくさがあった.本稿では,話速変換音声に映像を同期する映像会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手側の反応潜時を計測し比較をした.その結果をもとに,映像同期で会話がしやすくなったのか議論する. |
(英) |
Speech rate conversion (SRC) is a technology that converts playback speed of speeches while maintaining their vocal pitches. As an application of SRC, we develop visual-mediated SRC conversation system for supporting aurally impaired. In our previous studies, we have assumed that real-time video transmission is useful to share current situations of participants in conversation,even though voice and video are asynchronously conveyed. However, in the system speaker gaze information addressing next speaker may be erroneously recognized by hearers. In this study, we implemented a video conversation system that synchronizes video with SRC voice, then, performed experimental 3-party conversations. From the video recorded conversations we measured response latency and discuss the effects of video-to-audio synchronized conversations. |
キーワード |
(和) |
話速変換 / 音声映像同期 / 次話者指定 / 3人会話 / / / / |
(英) |
speech rate conversion / audio-video synchronization / speaker's addressing / three party conversations / / / / |
文献情報 |
信学技報, vol. 117, no. 509, HCS2017-105, pp. 71-76, 2018年3月. |
資料番号 |
HCS2017-105 |
発行日 |
2018-03-06 (HCS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HCS2017-105 |