お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-12-12 11:00
罹患者への定型的応答を利用したツイート罹患判定のデータ拡張
浅川玲音秋葉友良豊橋技科大NLC2018-31
抄録 (和) 本研究は,Twitterを用いた疾病サーベイランスのためのツイートの罹患判定に取り組む.これは伝染病流行検出システム等に応用される.
罹患判定の先行研究の多くは教師あり機械学習による手法を用いていており,教師あり学習を行うためにはラベル付きコーパスが必要となる.しかし,そのためのラベル付きコーパスの準備には非常に高いコストがかかる.
我々は,罹患者への定型的応答を利用して自動的に学習コーパスを獲得する方法を提案した.
本論文では,この自動獲得したコーパスを用いてRNNベースの罹患判定器の学習データをデータ拡張するアプローチを提案する.
この手法では,まず自動獲得した大量の自動獲得コーパスを用いて罹患判定器の各パラメータを学習しておく.次に人手でラベル付けされた少量のコーパスを用いて,前段階で学習したパラメータを初期値として学習を進める.
このように学習を二段階に分けることで,互いの性質を補完し合う形で二種類のコーパスを効果的に組み合わせることができる.
提案手法の評価実験として,RNNベースの罹患判定器の学習に提案するデータ拡張手法を適用し,その分類精度を拡張を行わなかったモデルと比較評価した結果,提案するデータ拡張を行ったモデルが拡張を行わなかったモデルの精度を上回ったことを確認した. 
(英) In this study, we try to identify patients' tweets for symptom surveillance using Twitter.
This functionality is indispensable for developing a system Identifying disease epidemic.
Most previous work employed a supervised machine learning methods.
In general, they need a large amount of labeled corpus, which are very expensive to be created.
In order to cope with this problem, we proposed a method to automatically acquire training corpus from Twitter by using a typical response to a patient.
In this paper, we propose a data augmentation approach that extends a training data for RNN-based patient identifier with those automatically acquired corpus.
The method consists of two steps.
As the first step, initial parameters of identifier are trained by the automatically required large corpus.
As the Second step, they are continuously trained by using a small amount of training corpus annotated manually.
By this method, it is possible to effectively combine two kinds of corpus in a manner complementing each other.
We experimented to apply the proposed data augmentation method for the training of RNN-based patient identifiers.
The result showed the proposed model successfully improved the identification performance over the model without data augmentation.
キーワード (和) RNN / Twitter / DataAugmentation / Fine-tuning / / / /  
(英) RNN / Twitter / DataAugmentation / Fine-tuning / / / /  
文献情報 信学技報, vol. 118, no. 355, NLC2018-31, pp. 55-60, 2018年12月.
資料番号 NLC2018-31 
発行日 2018-12-04 (NLC) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.
PDFダウンロード NLC2018-31

研究会情報
研究会 NLC IPSJ-NL SP IPSJ-SLP  
開催期間 2018-12-10 - 2018-12-12 
開催地(和) 早稲田大学西早稲田キャンパス 
開催地(英) Waseda Univ. Nishiwaseda Campus 
テーマ(和) 第5回自然言語処理シンポジウム & 第20回音声言語シンポジウム 
テーマ(英) The 5th Natural Language Processing Symposium & The 20th Spoken Language Symposium 
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2018-12-NLC-NL-SP-SLP 
本文の言語 日本語 
タイトル(和) 罹患者への定型的応答を利用したツイート罹患判定のデータ拡張 
サブタイトル(和)  
タイトル(英) Data augmentation using stereotypical reply for patients' tweet identification 
サブタイトル(英)  
キーワード(1)(和/英) RNN / RNN  
キーワード(2)(和/英) Twitter / Twitter  
キーワード(3)(和/英) DataAugmentation / DataAugmentation  
キーワード(4)(和/英) Fine-tuning / Fine-tuning  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 浅川 玲音 / Reine Asakawa / アサカワ レイネ
第1著者 所属(和/英) 豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University of Technology (略称: TUT)
第2著者 氏名(和/英/ヨミ) 秋葉 友良 / Tomoyosi Akiba / アキバ トモヨシ
第2著者 所属(和/英) 豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University of Technology (略称: TUT)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2018-12-12 11:00:00 
発表時間 30分 
申込先研究会 NLC 
資料番号 NLC2018-31 
巻番号(vol) vol.118 
号番号(no) no.355 
ページ範囲 pp.55-60 
ページ数
発行日 2018-12-04 (NLC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会