講演抄録/キーワード |
講演名 |
2008-11-28 14:10
翻訳リペア支援のためのWeb日本語Nグラムを用いた類義語フィルタリング ○宮部真衣・吉野 孝(和歌山大) AI2008-38 |
抄録 |
(和) |
機械翻訳を用いたコミュニケーションにおいて,翻訳リペアは不適切な翻訳箇所を減少させるための方法として重要な役割を果たす.翻訳リペア作業はユーザへの負担が大きいため,修正の必要な単語の類義語や関連語を提示することによる言い換え作業の支援が必要である.しかし,提示数が多い場合,適切なものを選び出すことは容易ではないと考えられる.本稿では,より適切な言い換え候補の抽出のためにWeb日本語Nグラムを用いたフィルタリングを提案する.また,2-gramおよび3-gramのデータを利用し,前方品詞2-gram,後方品詞2-gram,3-gramの3種類の単語の組み合わせによるフィルタリング実験を行い,以下の知見を得た.(1)Web日本語Nグラムを用いたフィルタリングにより,90%前後の単語について,言い換え候補を7語未満に絞り込むことができており,多数の候補を絞り込むことができる可能性がある.(2)閾値を0とした場合,3-gramによるフィルタリングにおいて抽出失敗率が最も高く(34.4%),後方品詞2-gramが最も低く(15.9%)なった.また,除外失敗率については前方品詞2-gramが最も高く(52.7%),3-gramが最も低く(28.6%)となった.(3)複数品詞により構成される言い換え候補については形態素解析を行い,言い換え候補の構成品詞数に応じて利用するNグラムデータを変更することで,
抽出失敗を減少できる可能性がある. |
(英) |
Translation repair has an important role in creating text that has a minimum amount of improper translations during communications using machine translation. However, deciding the repair strategy to be used is a heavy burden on the user, and a mechanism to reduce the user burden is required.
Thus, we will investigate methods to support paraphrasing by providing synonyms and related words for terms that need repair. In this paper, we propose a filter based on Web Japanese N-grams to extract more appropriate paraphrase candidates. In addition, we carried out an experiment using the proposed method, and found the following results. (1) By using a filter based on Web Japanese N-grams, paraphrase candidates were reduced to less than 7 terms in more than 90% of the words. There is a possibility that a large number of candidates can be narrowed down to a few terms. (2) The maximum rate of extraction failure was 34.4% in 3-gram, and the minimum of that was 15.9% in backward part of speech 2-gram at threshold 0. The maximum rate of elimination failure was 52.7% in front part of speech 2-gram, and the minimum of that was 28.6% in 3-gram. (3) Extraction failure is reduced by change to n-gram data corresponding to the number of parts of speech in each paraphrase candidate. |
キーワード |
(和) |
多言語間コミュニケーション / 機械翻訳 / 翻訳リペア / Web日本語Nグラム / / / / |
(英) |
multilingual communications / machine translation / translation repair / Web Japanese N-gram / / / / |
文献情報 |
信学技報, vol. 108, no. 325, AI2008-38, pp. 85-90, 2008年11月. |
資料番号 |
AI2008-38 |
発行日 |
2008-11-20 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2008-38 |
研究会情報 |
研究会 |
AI IPSJ-DC |
開催期間 |
2008-11-27 - 2008-11-28 |
開催地(和) |
琉球大学 工学部大会議室(工学部2号館2階) |
開催地(英) |
|
テーマ(和) |
情報社会のデザイン:デジタルドキュメントと知的コミュニケーション |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
AI |
会議コード |
2008-11-AI-DD |
本文の言語 |
日本語 |
タイトル(和) |
翻訳リペア支援のためのWeb日本語Nグラムを用いた類義語フィルタリング |
サブタイトル(和) |
|
タイトル(英) |
Synonym Filtering Using Web Japanese N-grams for Translation Repair Support |
サブタイトル(英) |
|
キーワード(1)(和/英) |
多言語間コミュニケーション / multilingual communications |
キーワード(2)(和/英) |
機械翻訳 / machine translation |
キーワード(3)(和/英) |
翻訳リペア / translation repair |
キーワード(4)(和/英) |
Web日本語Nグラム / Web Japanese N-gram |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
宮部 真衣 / Mai Miyabe / ミヤベ マイ |
第1著者 所属(和/英) |
和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.) |
第2著者 氏名(和/英/ヨミ) |
吉野 孝 / Takashi Yoshino / ヨシノ タカシ |
第2著者 所属(和/英) |
和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2008-11-28 14:10:00 |
発表時間 |
30分 |
申込先研究会 |
AI |
資料番号 |
AI2008-38 |
巻番号(vol) |
vol.108 |
号番号(no) |
no.325 |
ページ範囲 |
pp.85-90 |
ページ数 |
6 |
発行日 |
2008-11-20 (AI) |