ニューラル機械翻訳システムに対する敵対的攻撃

坂本,岳史; 森,達哉

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2020-03-03 11:20 ニューラル機械翻訳システムに対する敵対的攻撃 ○坂本岳史・森　達哉（早大） ICSS2019-89
抄録	（和）	ニューラルネットワークを搭載するシステムには，正当な入力に微小な摂動を加えた悪意ある入力 (Adversarial Example)を印加することにより，意図的に誤動作が引き起こされる脆弱性が指摘されている．本研究では，ニューラル機械翻訳システムを標的とし，微小な摂動を加えた文 (敵対的文) を翻訳機に入力することにより，翻訳後の意味を変化させる攻撃を提案する．また，提案した攻撃の実現可能性評価と，有効な対策手法の検討を行う．本攻撃により，契約文書，商品のレビュー，政治家や有識者のSNS投稿など，人の意思決定に影響を与える文書を機械翻訳した際に，文書の意味やニュアンスが意図的に制御されるリスクが生じる．本研究では，機械翻訳システムとして広く使われているGoogle翻訳を対象とし，日常的に使用する基本的な文データを基に作成した敵対的文の意味変更率を評価する．実験の結果，55%の文に対し，翻訳後の意味を変化させることに成功した．これはテキスト分類を対象とした既存の敵対的入力生成手法と比較しても良好な成功率である．
	（英）	It has been widely known that systems empowered by neural network algorithms are vulnerable against an intrinsic attack named ``adversarial example'', which can be generated by adding small perturbations to the original inputs, aiming at fooling the systems. In this paper, we target Neural Machine Translation (NMT) and present attacks that change the meaning of sentences by adding small perturbations to the translated sentences (Adversarial text). This attack can intentionally control the nuance of meanings for documents such as contracts, products, reviews and postings to SNS by politicians or experts, which may play a vital role in making a decision. In this work, we adopt Google translate as a widely used NMT system and apply our attack using common sentences to study the effectiveness of the attack. We demonstrate that the meaning of sentences could be changed by 55% and the success rate is higher than the existing methods that target text classification applications.
キーワード	（和）	Adversarial Example / ニューラル機械翻訳 / ホモグリフ / / / / /
	（英）	Adversarial Example / Neural Machine Translation / Homoglyph / / / / /
文献情報		信学技報, vol. 119, no. 437, ICSS2019-89, pp. 125-130, 2020年3月.
資料番号		ICSS2019-89
発行日		2020-02-24 (ICSS)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		ICSS2019-89

研究会情報
研究会	ICSS IPSJ-SPT
開催期間	2020-03-02 - 2020-03-03
開催地（和）	沖縄県青年会館
開催地（英）	Okinawa-Ken-Seinen-Kaikan
テーマ（和）	セキュリティ、トラスト、一般
テーマ（英）	Security, Trust, etc.
講演論文情報の詳細
申込み研究会	ICSS
会議コード	2020-03-ICSS-SPT
本文の言語	日本語
タイトル（和）	ニューラル機械翻訳システムに対する敵対的攻撃
サブタイトル（和）
タイトル（英）	Adversarial Attack against Neural Machine Translation Systems
サブタイトル（英）
キーワード(1)（和/英）	Adversarial Example / Adversarial Example
キーワード(2)（和/英）	ニューラル機械翻訳 / Neural Machine Translation
キーワード(3)（和/英）	ホモグリフ / Homoglyph
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	坂本岳史 / Takeshi Sakamoto / サカモトタケシ
第1著者所属（和/英）	早稲田大学 (略称：早大) Waseda University (略称： Waseda Univ.)
第2著者氏名（和/英/ヨミ）	森達哉 / Tatsuya Mori / モリタツヤ
第2著者所属（和/英）	早稲田大学 (略称：早大) Waseda University (略称： Waseda Univ.)
第3著者氏名（和/英/ヨミ）	/ /
第3著者所属（和/英）	(略称： ) (略称： )
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2020-03-03 11:20:00
発表時間	20分
申込先研究会	ICSS
資料番号	ICSS2019-89
巻番号（vol）	vol.119
号番号（no）	no.437
ページ範囲	pp.125-130
ページ数	6
発行日	2020-02-24 (ICSS)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会