お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2022-03-07 15:50
疑似データ獲得による直喩文判定手法と分類モデルの考察
自見仁太朗嶋田和孝九工大NLC2021-36
抄録 (和) 比喩の一種である直喩は,``ような''などの定型語 (喩詞)により比喩の対象を明示する表現である.
しかし,喩詞として用いられる``ような''という語は,例示や婉曲の意味でも使用されるため,使われ方によって文意が大きく異なる.このような文を判別することは,文章を理解するうえで重要となる.
一般に,比喩検出を分類問題として機械学習で解くという方法が考えられる.しかし,機械学習でこのタスクを行うためには直喩文と非直喩文それぞれの大量のテキストデータが訓練データとして必要になる.
そして,これらのデータセットを人手で作成するには大きなコストがかかる.
そこで,本研究ではデータセットの自動獲得とそのデータセットを用いた直喩文判定モデルについて提案する.対象は ``のような''と ``のように''を含む文とし,直喩文判定を直喩文か非直喩文に分類する二値分類問題として定義する.
実験では獲得したデータセットを用いて複数のモデルで直喩文判定に取り組み,本タスクへの有効性を確認した. 
(英) Simile is a kind of figurative language.
It expresses the target of the figurative language by using comparators such as ``like''.
For understanding a sentence, it is important to distinguish whether the sentence is a simile or a literal.
In this paper, we propose a pseudo dataset acquisition method for simile identification.
We first constructed a dataset of simile and literal sentences using machine translation.
Next, we define the simile identification task as a binary classification problem.
We apply some machine learning approaches to the task.
We show the validity of the pseudo dataset and the models in this task.
キーワード (和) 直喩文判定 / 疑似データ / 訓練データ自動獲得 / 比喩 / / / /  
(英) simile identification / pseudo data / automatic training data acquisition / figurative language / / / /  
文献情報 信学技報, vol. 121, no. 415, NLC2021-36, pp. 48-53, 2022年3月.
資料番号 NLC2021-36 
発行日 2022-02-28 (NLC) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2021-36

研究会情報
研究会 NLC  
開催期間 2022-03-07 - 2022-03-07 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 観光情報処理と一般 
テーマ(英) Information Processing of Tourism, etc. 
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2022-03-NLC 
本文の言語 日本語 
タイトル(和) 疑似データ獲得による直喩文判定手法と分類モデルの考察 
サブタイトル(和)  
タイトル(英) Simile identification based on machine learning using pseudo data acquisition 
サブタイトル(英)  
キーワード(1)(和/英) 直喩文判定 / simile identification  
キーワード(2)(和/英) 疑似データ / pseudo data  
キーワード(3)(和/英) 訓練データ自動獲得 / automatic training data acquisition  
キーワード(4)(和/英) 比喩 / figurative language  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 自見 仁太朗 / Jintaro Jimi / ジミ ジンタロウ
第1著者 所属(和/英) 九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: Kyutech)
第2著者 氏名(和/英/ヨミ) 嶋田 和孝 / Kazutaka Shimada / シマダ カズタカ
第2著者 所属(和/英) 九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: Kyutech)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2022-03-07 15:50:00 
発表時間 25分 
申込先研究会 NLC 
資料番号 NLC2021-36 
巻番号(vol) vol.121 
号番号(no) no.415 
ページ範囲 pp.48-53 
ページ数
発行日 2022-02-28 (NLC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会