お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-06-19 15:00
深層学習に基づく楽器音分類のための画像分類ネットワークを用いたファインチューニング
城間佑樹木下裕磨塩田さやか貴家仁志都立大SP2021-17
抄録 (和) 本研究では,楽器音分類タスクに画像分類ネットワークを用いる際のファインチューニングのためのチャネル変換法の比較評価を行う.近年,環境音識別や感情認識など様々なタスクにおいて深層学習を用いた手法が提案されている.また,深層学習に用いる学習データが少ない場合に,画像分類タスクのネットワークでファインチューニングを行うことで音に関するタスクの性能が改善することが報告されている.音を入力とする場合は画像ネットワークの入力に対応させるためにスペクトログラムを用いることが多いが,スペクトログラムが1チャネルデータとなっているのに対し,画像の入力を前提にしたネットワークはRGBの3チャネルデータが入力されることを想定しているため,チャネル数を合わせる必要がある.チャネルを変換する手法としてこれまでに,各チャネルに同じデータを複製をする手法,動的特徴量を用いる手法,スペクトログラムをカラー画像化する手法などが提案されているが,手法の違いが精度にどの程度影響するか明らかにされていない.そこで本研究では,様々なチャネル変換法がファインチューニングの結果にどのような影響を与えるのかについて比較を行う.本実験では,ImageNetと呼ばれる大規模な画像データを用いて学習されたネットワークに対してファインチューニングを行い楽器音分類を行った.チャネル変換法として6種類の手法を比較したところ,実験結果よりカラー画像化がImageNetに適していたことを報告する. 
(英) In this paper, we investigate abilities of channel conversion methods for fine-tuning with image classification networks under deep neural network-based musical instrument classification. Recently, many deep neural network-based methods have been proposed for scene classification, emotion recognition tasks, and so on. It has also been reported that fine-tuning techniques with well-trained networks using large-scale image dataset improve the performance of sound classification tasks when the limited amount of training data is available. In this case, while a spectrogram extracted from sound data is usually regarded as an image and inputted to the fine-tuned networks with the image classification tasks, the spectrogram image is not suitable to the fine-tuned network because the input of the image classification networks assumes the three channel data like RGB. In this case, the spectrogram is required to be converted to the three channel data, and many methods such as spectrogram duplication method, a method using delta as coefficients and colorization of a spectrogram have been proposed. However, there is no discussion how these methods affect the accuracies. Therefore, we compare various channel conversion methods via fine-tuning of the image classification networks. In the experiments, we performed musical instrument classificaiton with fine-tuning of the well-trained networks by ImageNet. From the results, compared among six channel conversion methods, the colorization of a spectrogram was the most suitable for the fine-tuning with the image classification networks.
キーワード (和) 楽器音分類 / 画像分類ネットワーク / ファインチューニング / チャネル変換 / / / /  
(英) Acoustic musical instrument classification / image classification network / fine-tuning / channel conversion / / / /  
文献情報 信学技報, vol. 121, no. 66, SP2021-17, pp. 75-79, 2021年6月.
資料番号 SP2021-17 
発行日 2021-06-11 (SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2021-17

研究会情報
研究会 SP IPSJ-SLP IPSJ-MUS  
開催期間 2021-06-18 - 2021-06-19 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 音学シンポジウム2021 
テーマ(英) OTOGAKU Symposium 2021 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2021-06-SP-SLP-MUS 
本文の言語 日本語 
タイトル(和) 深層学習に基づく楽器音分類のための画像分類ネットワークを用いたファインチューニング 
サブタイトル(和)  
タイトル(英) Investigation on fine-tuning with image classification networks for deep neural network-based musical instrument classification 
サブタイトル(英)  
キーワード(1)(和/英) 楽器音分類 / Acoustic musical instrument classification  
キーワード(2)(和/英) 画像分類ネットワーク / image classification network  
キーワード(3)(和/英) ファインチューニング / fine-tuning  
キーワード(4)(和/英) チャネル変換 / channel conversion  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 城間 佑樹 / Yuki Shiroma / シロマ ユウキ
第1著者 所属(和/英) 東京都立大学 (略称: 都立大)
Tokyo Metropolitan University (略称: TMU)
第2著者 氏名(和/英/ヨミ) 木下 裕磨 / Yuma Kinoshita / キノシタ ユウマ
第2著者 所属(和/英) 東京都立大学 (略称: 都立大)
Tokyo Metropolitan University (略称: TMU)
第3著者 氏名(和/英/ヨミ) 塩田 さやか / Sayaka Shiota / シオタ サヤカ
第3著者 所属(和/英) 東京都立大学 (略称: 都立大)
Tokyo Metropolitan University (略称: TMU)
第4著者 氏名(和/英/ヨミ) 貴家 仁志 / Hitoshi Kiya / キヤ ヒトシ
第4著者 所属(和/英) 東京都立大学 (略称: 都立大)
Tokyo Metropolitan University (略称: TMU)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2021-06-19 15:00:00 
発表時間 120分 
申込先研究会 SP 
資料番号 SP2021-17 
巻番号(vol) vol.121 
号番号(no) no.66 
ページ範囲 pp.75-79 
ページ数
発行日 2021-06-11 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会