講演抄録/キーワード |
講演名 |
2009-01-26 14:30
N-Best疑似コーパスを利用したピボット翻訳 ○大熊英男(NICT/ATR)・山本博史(近畿大/NICT/ATR)・隅田英一郎(NICT/ATR) NLC2008-72 |
抄録 |
(和) |
統計的機械翻訳では大きな対訳コーパスを必要とするが、言語ペアによっては対訳コーパスを集めることが困難な場合がある。この問題を解決するためにピボット翻訳という手法がある。ピボット翻訳においては第三の言語をピボット言語として利用する。本稿ではこれまで提案されてきたピボット翻訳手法を組み合わせることにより、大きな向上を確認した。 |
(英) |
In statistical machine translation (SMT) systems, a large bilingual corpus is required for training a translation model. However, in the case of some language pairs, it is very difficult to collect a bilingual corpus. Hence, pivot translation is used to avoid collecting a bilingual corpus. In pivot translation, a third language is used as the pivot language. In this paper, we describe a method to combine the previous pivot translation methods and we were able to obtain a significant improvement over the previous methods. |
キーワード |
(和) |
統計的機械翻訳 / ピボット翻訳 / / / / / / |
(英) |
statistical machine translation / pivot translation / / / / / / |
文献情報 |
信学技報, vol. 108, no. 408, NLC2008-72, pp. 7-12, 2009年1月. |
資料番号 |
NLC2008-72 |
発行日 |
2009-01-19 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2008-72 |