講演抄録/キーワード |
講演名 |
2018-12-12 11:00
罹患者への定型的応答を利用したツイート罹患判定のデータ拡張 ○浅川玲音・秋葉友良(豊橋技科大) NLC2018-31 |
抄録 |
(和) |
本研究は,Twitterを用いた疾病サーベイランスのためのツイートの罹患判定に取り組む.これは伝染病流行検出システム等に応用される.
罹患判定の先行研究の多くは教師あり機械学習による手法を用いていており,教師あり学習を行うためにはラベル付きコーパスが必要となる.しかし,そのためのラベル付きコーパスの準備には非常に高いコストがかかる.
我々は,罹患者への定型的応答を利用して自動的に学習コーパスを獲得する方法を提案した.
本論文では,この自動獲得したコーパスを用いてRNNベースの罹患判定器の学習データをデータ拡張するアプローチを提案する.
この手法では,まず自動獲得した大量の自動獲得コーパスを用いて罹患判定器の各パラメータを学習しておく.次に人手でラベル付けされた少量のコーパスを用いて,前段階で学習したパラメータを初期値として学習を進める.
このように学習を二段階に分けることで,互いの性質を補完し合う形で二種類のコーパスを効果的に組み合わせることができる.
提案手法の評価実験として,RNNベースの罹患判定器の学習に提案するデータ拡張手法を適用し,その分類精度を拡張を行わなかったモデルと比較評価した結果,提案するデータ拡張を行ったモデルが拡張を行わなかったモデルの精度を上回ったことを確認した. |
(英) |
In this study, we try to identify patients' tweets for symptom surveillance using Twitter.
This functionality is indispensable for developing a system Identifying disease epidemic.
Most previous work employed a supervised machine learning methods.
In general, they need a large amount of labeled corpus, which are very expensive to be created.
In order to cope with this problem, we proposed a method to automatically acquire training corpus from Twitter by using a typical response to a patient.
In this paper, we propose a data augmentation approach that extends a training data for RNN-based patient identifier with those automatically acquired corpus.
The method consists of two steps.
As the first step, initial parameters of identifier are trained by the automatically required large corpus.
As the Second step, they are continuously trained by using a small amount of training corpus annotated manually.
By this method, it is possible to effectively combine two kinds of corpus in a manner complementing each other.
We experimented to apply the proposed data augmentation method for the training of RNN-based patient identifiers.
The result showed the proposed model successfully improved the identification performance over the model without data augmentation. |
キーワード |
(和) |
RNN / Twitter / DataAugmentation / Fine-tuning / / / / |
(英) |
RNN / Twitter / DataAugmentation / Fine-tuning / / / / |
文献情報 |
信学技報, vol. 118, no. 355, NLC2018-31, pp. 55-60, 2018年12月. |
資料番号 |
NLC2018-31 |
発行日 |
2018-12-04 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
NLC2018-31 |
研究会情報 |
研究会 |
NLC IPSJ-NL SP IPSJ-SLP |
開催期間 |
2018-12-10 - 2018-12-12 |
開催地(和) |
早稲田大学西早稲田キャンパス |
開催地(英) |
Waseda Univ. Nishiwaseda Campus |
テーマ(和) |
第5回自然言語処理シンポジウム & 第20回音声言語シンポジウム |
テーマ(英) |
The 5th Natural Language Processing Symposium & The 20th Spoken Language Symposium |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2018-12-NLC-NL-SP-SLP |
本文の言語 |
日本語 |
タイトル(和) |
罹患者への定型的応答を利用したツイート罹患判定のデータ拡張 |
サブタイトル(和) |
|
タイトル(英) |
Data augmentation using stereotypical reply for patients' tweet identification |
サブタイトル(英) |
|
キーワード(1)(和/英) |
RNN / RNN |
キーワード(2)(和/英) |
Twitter / Twitter |
キーワード(3)(和/英) |
DataAugmentation / DataAugmentation |
キーワード(4)(和/英) |
Fine-tuning / Fine-tuning |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
浅川 玲音 / Reine Asakawa / アサカワ レイネ |
第1著者 所属(和/英) |
豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University of Technology (略称: TUT) |
第2著者 氏名(和/英/ヨミ) |
秋葉 友良 / Tomoyosi Akiba / アキバ トモヨシ |
第2著者 所属(和/英) |
豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University of Technology (略称: TUT) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-12-12 11:00:00 |
発表時間 |
30分 |
申込先研究会 |
NLC |
資料番号 |
NLC2018-31 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.355 |
ページ範囲 |
pp.55-60 |
ページ数 |
6 |
発行日 |
2018-12-04 (NLC) |