1-3 機械翻訳 開発者とLSPが語る、今、そして未来
鈴木 博和
株式会社東芝 研究開発センター 研究企画部 企画担当
渡邊 麻呂
株式会社十印 代表取締役社長
報告者●矢野 直子(PFUソフトウェア株式会社)
機械翻訳(MT)をとりまく三者(ユーザー、LSP、MTメーカー)の役割、関係はどうあるべきなのか。
MTエンジン開発者の視点
研究の現場ではRBMTとSMTはライバル関係、ととらえられてきたが、最近はどちらの精度が高いのか、という議論ではなく、SMTの手法が肯定されつつある。
人間翻訳(HT)とMTは、本当に競合関係にあるのか?
いまは「機械と争う」のではなく、「機械を使って争う」時代。手作業をしていた人間が仕事を失っていった産業革命の頃、世の中は衰退したのではなく、人間が機械をうまく使うようになって経済は発展してきた。MTは人間にうまく使ってもらう方が良い。競争する関係ではなく、MTでどういう結果がでてきたら人間が上手く使えるのか、人間に喜んでもらるのか、にフォーカスしはじめている。
LSPの視点
LSPは分野、種類を限定し、ワークフローを工夫してMTを使っているが、限定的な使用に留まっている。
一方、ユーザーがMTを購入し、LSPがPEをするというビジネスモデルが非常に多い。
しかし、MT出力だけがLSPに提供されることにより、その修正に非常に工数がかかる。
LSPはMTエンジンの特性を知らないまま渡されるため、すべてを見直す必要があり、人間が翻訳し直した方が早い場合がある。
ユーザーを知るLSPが開発者と協業することにより、MTは向上し、もっと広くダイナミックに使えるものになるはず。
開発者が語る翻訳ワークフローの未来像
理想形はすべてがつながっているもの。
機械翻訳し、翻訳メモリも使う。もちろん人間翻訳もする。これらの作業結果がすべて(たとえばデータベースに)保存されていて、TMでの修正結果やPE結果を次回も使えたり、MTの中の知識として使えたり、辞書引き的なものとしても使えるなど、すべてのモジュール/フローがシームレスに結びつき、誰が何をしてもそれがその後の作業に反映されていく、という形が求められているように思う。さらにプレエディット/ポストエディットの知識をツールの本体に活かしていく、ということも考えていく必要がある。これはMTメーカーだけでは実現できない。
LSPが語る翻訳ワークフローの未来像
一番大事なことは用途による使い分け。どういう結果がほしいのか、によってワークフローは変わり、MTの範囲とHTの範囲も変わってくるはず。その部分を見極めた上で成果物/結果を出していきたい。同時に日本だけではなくグローバルに、かつセキュリティを担保した環境でMTと世界中のリソースをフローに組み込めることが重要。
またMT出力結果に関する明確な評価結果が欲しい。さらに各MTエンジンの辞書/コーパスをそのエンジン限定にせず(専門分野を特化して)共有できるとよい。それによってツールとしての機能/特性にフォーカスして使うことができる。そんな時代がいつか来るのだとしたら早い方が良い。
講演資料のダウンロードはこちら
*ダウンロードには、参加者のみに別途メールでお送りしておりますパスワードが必要になります。