2-2 機械翻訳による競争戦略 ─機械翻訳で差別化できるか─
秋元 圭
株式会社クロスランゲージアールアンドディ、エンジングループ マネージャ
目次 由美子
株式会社シュタール ジャパン、情報技術企画部 テクニカルマネジャー
山本 ゆうじ
長瀬 友樹
株式会社富士通研究所、メディア処理システム研究所 主管研究員
報告者●津田 美貴(個人翻訳者)
本セッションは、アジア太平洋機械翻訳協会(AAMT)により企画され、機械翻訳の最新動向と機械翻訳による差別化についてディスカッションが行われた。ここでの機械翻訳とは(人間ではなく)ソフト処理による翻訳である。
なぜ日本語を中心とした翻訳では機械翻訳の成功事例はまだ少ないのか?という点からディスカッションが始まった。機械翻訳の種類によっては、一般ユーザー向けの「概訳」としては役立つことがあっても、翻訳者が「精訳」を作る目的では使えず、かえって翻訳者の足を引っ張るからという意見がでた。
そこで、なぜ機械翻訳ソフトが期待通りの訳をせず誤訳するのかを、機械翻訳開発者の立場から秋元氏が解説。続いて、翻訳支援(翻訳メモリー)ツールで機械翻訳機能を利用する方法を、翻訳メモリー開発者の立場から目次氏が解説。さらに、機械側の問題以外にも導入する際の人間側の問題について、機械翻訳の導入を手がけてきた山本氏が指摘し、機械翻訳導入が失敗する要因として①翻訳、工程全体を見ていない、②自動化への過剰な期待、③用語集の軽視、④技能不足(基礎IT技能、翻訳など)を挙げた。
これらの話を踏まえて、機械翻訳でよい効果を出すためには、①用語集の重要性、②機械翻訳でも訳しやすい日本語の翻訳元原稿を書く(ライティング手法)から始めてはという結論に達した。
まず、信頼できる用語集を用意する。たとえば、theaterという単語は、演劇なら「劇団」や「観客」、医学なら「手術室」、軍事なら「戦域」と訳が異なる。機械翻訳では用語集に載っていない訳語は、適切な訳をつけられず、誤訳につながる。また、人間翻訳の際の訳語統一の観点からも用語集の利用は必須である。そのため、さまざまな環境ですぐに共有・再利用できるようにデータ形式を整えることも大切である。そこで、AAMTが策定した、簡単に作れ、使用できる用語集形式UTX (http://www.aamt.info/japanese/utx/) が紹介された。
さらに日本語ライティングの改善や前編集により、翻訳原稿を機械翻訳で訳しやすくできる。方法として①100字を超えたら1文を分ける、②曖昧な表現を避ける(特に動詞)、③誤字・脱字・誤記をなくす、などがある。①で1文を100字以下にするだけで、機械翻訳の翻訳精度は格段に上がり、翻訳メモリーも一致しやすくなる。②では、「~になる」「~をする」「~を行う」などの多義的な用語を、限定的な意味を持つ動詞に変える。たとえば「遊園地は屋上になります」ではなく「遊園地は屋上にあります」とすると誤訳されにくくなる。③の誤字・脱字・誤記は、特に機械翻訳では誤訳の原因になる。たとえば、「絶対絶命」と誤記されていても、人間は「絶体絶命」と理解して正しく訳せるが、機械翻訳は文字通り訳そうとして誤訳する。
結論として、翻訳品質を向上して機械翻訳による差別化を実現するには、用語集の活用と原文の調整が効果的であることが示された。
講演資料のダウンロードはこちら
*ダウンロードには、参加者のみに別途メールでお送りしておりますパスワードが必要になります。