お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2023-06-23 13:50
[ポスター講演]歌詞と歌唱音声のアライメント崩れに基づく替え歌検知
有賀智輝樋口陽祐早大)・菅野光則執行里恵水口天都岡本直紀第一興商)・小川哲司早大SP2023-10
抄録 (和) 替え歌を含むカラオケ歌唱音声に対して,正解歌詞との強制アライメントを行い,アライメントの崩れ具合を評価することで替え歌を検知することを試みた.替え歌の検知は,歌唱音声がインターネット上で配信される際における著作権侵害の有無の確認や,カラオケの採点アルゴリズムの精度向上に貢献する.歌唱音声には正解の歌詞が必ず存在するため,音響モデルを用いた強制アライメントを適用することができる.しかし,歌詞が正しく歌われていない場合や,替え歌が含まれている場合には音響特徴とのミスマッチによってアライメントがうまく取れず,崩れる可能性がある.本研究の目的は,このアライメントの崩れを利用して替え歌を検知するシステムを構築することである.そのために,推定されたアライメントの崩れ具合を評価するために適切な尺度を調査する.このとき,リズムの取り方の違いなど,歌唱者の個人性に対して頑健な評価尺度を設計する.実験では,正確なアライメントの推定を行うために,日本語のカラオケ歌唱データセットを構築し,これを用いて歌唱音声に基づいた音響モデルを構築する.替え歌検知実験の結果,編集距離に基づく提案の評価尺度を用いることで,Area Under the Curve(AUC)で0.963を与える高い検知性能を得られることが明らかとなった. 
(英) We propose a parody detection system for karaoke singing by evaluating alignment collapse between lyrics and singing voice. The detection of parodies plays a crucial role in identifying copyright infringements in online karaoke recordings, while also enhancing the quality of singing evaluation algorithms. Considering that, for a particular song, the ground-truth transcriptions (i.e., lyrics) remain constant, we can employ an acoustic model to achieve forced alignment between lyrics and the corresponding singing voice. However, when a singing voice is performed with incorrect lyrics or parodies, the alignment estimation may become challenging due to discrepancies in the acoustic features. Our objective is to identify the potential alignment collapse for detecting parodies in singing voice. To this end, we examine various metrics to assess the degree of collapse in the estimated alignments. Furthermore, we develop metrics that are robust against variations among singers, such as modifications in rhythm arrangements. In the course of our experiments, we construct a Japanese singing voice dataset to train an acoustic model specific to the singing domain, which is crucial for estimating accurate alignments. The results suggest that our proposed system, which uses an edit-distance-based metric, is highly successful in detecting parodies, achieving an area under the curve (AUC) value of 0.963.
キーワード (和) 替え歌検知 / 歌唱音声 / 強制アライメント / カラオケ / / / /  
(英) Parody detection / singing voice / forced alignment / karaoke / / / /  
文献情報 信学技報, vol. 123, no. 88, SP2023-10, pp. 48-53, 2023年6月.
資料番号 SP2023-10 
発行日 2023-06-16 (SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2023-10

研究会情報
研究会 SP IPSJ-MUS IPSJ-SLP  
開催期間 2023-06-23 - 2023-06-24 
開催地(和) 電気通信大学 
開催地(英)  
テーマ(和) 音学シンポジウム2023 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2023-06-SP-MUS-SLP 
本文の言語 日本語 
タイトル(和) 歌詞と歌唱音声のアライメント崩れに基づく替え歌検知 
サブタイトル(和)  
タイトル(英) Parody Detection Based on Alignment Collapse Between Lyrics and Singing Voice 
サブタイトル(英)  
キーワード(1)(和/英) 替え歌検知 / Parody detection  
キーワード(2)(和/英) 歌唱音声 / singing voice  
キーワード(3)(和/英) 強制アライメント / forced alignment  
キーワード(4)(和/英) カラオケ / karaoke  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 有賀 智輝 / Tomoki Ariga / アリガ トモキ
第1著者 所属(和/英) 早稲田大学 (略称: 早大)
Waseda University (略称: Waseda Univ.)
第2著者 氏名(和/英/ヨミ) 樋口 陽祐 / Yosuke Higuchi / ヒグチ ヨウスケ
第2著者 所属(和/英) 早稲田大学 (略称: 早大)
Waseda University (略称: Waseda Univ.)
第3著者 氏名(和/英/ヨミ) 菅野 光則 / Mitsunori Kanno / カンノ ミツノリ
第3著者 所属(和/英) 株式会社第一興商 (略称: 第一興商)
DAIICHIKOSHO CO., LTD. (略称: DAIICHIKOSHO)
第4著者 氏名(和/英/ヨミ) 執行 里恵 / Rie Shigyo / シギョウ リエ
第4著者 所属(和/英) 株式会社第一興商 (略称: 第一興商)
DAIICHIKOSHO CO., LTD. (略称: DAIICHIKOSHO)
第5著者 氏名(和/英/ヨミ) 水口 天都 / Takato Mizuguchi / ミズグチ タカト
第5著者 所属(和/英) 株式会社第一興商 (略称: 第一興商)
DAIICHIKOSHO CO., LTD. (略称: DAIICHIKOSHO)
第6著者 氏名(和/英/ヨミ) 岡本 直紀 / Naoki Okamoto / オカモト ナオキ
第6著者 所属(和/英) 株式会社第一興商 (略称: 第一興商)
DAIICHIKOSHO CO., LTD. (略称: DAIICHIKOSHO)
第7著者 氏名(和/英/ヨミ) 小川 哲司 / Tetsuji Ogawa / オガワ テツジ
第7著者 所属(和/英) 早稲田大学 (略称: 早大)
Waseda University (略称: Waseda Univ.)
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2023-06-23 13:50:00 
発表時間 140分 
申込先研究会 SP 
資料番号 SP2023-10 
巻番号(vol) vol.123 
号番号(no) no.88 
ページ範囲 pp.48-53 
ページ数
発行日 2023-06-16 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会