講演抄録/キーワード |
講演名 |
2021-03-04 16:50
[ショートペーパー]CNNとTransformerエンコーダを用いたうつ状態の検出 ○劉 家慶(立命館大)・黄 越・黄 辛隠(蘇州大)・健山智子(滋賀大)・岩本祐太郎・陳 延偉(立命館大) PRMU2020-83 |
抄録 |
(和) |
ストレスが多い現代社会では"うつ病”が大きな問題になっており,早期発見と適切な治療により,大部分の改善が認められている.近年,深層学習の進歩に伴い,音声的特徴からのうつ状態検出の知識が蓄積されつつある.診察会話中,音声が健常者と違いが現れると,臨床現場から指摘されている.機械学習におけるTransformerモデルは、自然言語処理における業界標準になっています.しかし、現在までに、うつ状態の検出におけるtransformerの適切な構成方法は報告させていない.本研究では,CNN によりスペクトログラムをフレーム毎に特徴ベクトル化した後,その画像の特徴ベクトルを Transformer エンコーダに入力することで,Transformer エンコー ダの自己注意機構により,画像のフレーム間の関係を考慮 したエンコードを提案する.従来の手法に比べ検出精度が向上した. |
(英) |
Depressive symptoms are a massive problem in this stressful modern society. Early screening of depressive symptoms helps to reduce the number and intensity of their depressive episodes. Automatic detection of depressive symptoms from audio cues has gained increasing interest in recent years. Transformer-based neural networks represent a successful self-attention mechanism that achieves state-of-the-art results in language understanding and sequence modeling. However, their application to visual data and, in particular, to the depressive severity detection task has not yet been deeply investigated. In this paper, we propose a transformer-based architecture for the depressive task. The temporal feature analysis using transformer computed after the feature extraction performed by DensNet. Our experimental results show that the proposed method can achieve CCC of 0.34 when using the validation set and 0.24 when using the test set, significantly outperforming the baseline method score CCC of 0.165. |
キーワード |
(和) |
うつ病検出 / 深層学習 / 音声解析 / スペクトログラム / Transformer エンコーダ / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 120, no. 409, PRMU2020-83, pp. 83-85, 2021年3月. |
資料番号 |
PRMU2020-83 |
発行日 |
2021-02-25 (PRMU) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2020-83 |