MTソリューションセッション 講演2 「未来のMTと今のMTを考察」

2014年度第3回JTF関西セミナー報告
MTソリューションセッション 講演2
「未来のMTと今のMTを考察」


渡邊 麻呂(わたなべ まろ)


株式会社十印 代表取締役社長、JTF理事。
1999年、株式会社十印開発入社。関連人材派遣会社にて営業職に従事。
2003年、株式会社十印および株式会社十印開発 役員に就任。同年、株式会社十印ヒューマンフロンティア 営業マネージャを兼任。派遣営業業務の責任者として活躍。2004年、株式会社十印ヒューマンフロンティア代表取締役に就任。顧客の要望に即した社内体制へと改革を推進し、前年比2倍半以上の経常利益を達成。2005年、株式会社十印代表取締役に就任。50年にわたる株式会社十印の実績を引き継ぎ、さらに若さによる牽引。

加藤 隆継(かとう たかつぐ)

株式会社十印  エンジニアリング部
 



2014年度第3回JTF関西セミナー
日時●2015年1月30日(金)10:30~17:00
開催場所大阪大学中之島センター
テーマ機械翻訳と向き合うときが来た― MTをもっと身近に、現実的に考える ― MTソリューションセッション 講演2 「未来のMTと今のMTを考察」
講演者渡邊 麻呂(Watanabe Maro)株式会社十印 代表取締役社長、JTF理事/加藤 隆継(Kato Takatsugu)株式会社十印 エンジニアリング部
報告者渋谷 桂子(株式会社アスカコーポレーション)

 



MTソリューションセッション講演②として、実際に翻訳を提供している立場から株式会社十印の代表取締役社長 渡邊麻呂氏、加藤隆継氏より「機械翻訳の未来と現在」についてご講演いただいた。

MTの未来(夢)とは?

600万語の言語を自由に操ることができる映画「Star Wars」のロボットC-3POである。今はその夢に向かうプロセスの途中である。 

MTの歴史(波に例えると)

MTは波である。1940年代に軍事目的でMTの研究が始まる(さざ波)、1980年代に翻訳ソフトが販売される(波がくる→実際使えないため波がひく)、21世紀初頭にWeb翻訳の波、そして今、MTブームの波がきている。しかし、海外では大ブームだが、日本ではブームにはなっていない(使えるのか、使えないのか?まだ懐疑的)。波が引いたり出てきたりを繰り返して現在に至るが、波は大きくなっている。この波が最大限大きくなると、C3POになる。
21世紀初頭はルールベース主導(RBMT)であったが、今は統計翻訳(SMT)が主流である。理由は、SMTがヨーロッパ言語で英語と相性がよかったからである。しかし、現在では今まで相性の悪かった日本語やアジア言語でも成功例が多数ある。

SMTとRBMTの比較

SMTは大量のコーパスが必要に対し、RBMTはコーパスが不要。SMTは学習に時間がかかるが、RBMTはすぐに使い始めることが可能。ただし、SMTは学習が完了すると、翻訳が即座に完了する。SMTは幅広い言語ペアに対応できるが、RBMTはルールを言語ごとに作るため、言語ペアが限定される。SMTは語順の近い言語内で相性がよく、訳の品質は流暢。短い文章だと、人間と変わらない印象がある。RBMTはルールに則るため直訳調になることが多い。

SMTについて

統計は結局確率の話しである。確率が高ければ高い方が良い。宝くじと同じで当たったら素晴らしいが、外れたら何の意味もない。高い確率(=より良い品質)を得るには膨大な言語ペア(コーパス)が必要。ただし、コーパスは多ければよいのか?

十印でのSMTに関する検証

約800万の一般コーパス(ジャンルは特化)と、約40万のクライアントコーパス(クライアントに特化したコーパス)で翻訳結果を評価したところ、スコアに大差なし。つまり、コーパスを多数集めるのではなく、適正数量及び適正な品質のコーパスが必要。

十印の進む道

十印ではMTの使用がテーマではなく、クライアントが何をしたいのか、どんな結果が欲しいのか、目的は何か、を大切にしている。MTはエンジンが多数あり、特性も多岐にわたるため、クライアントの目的に合うエンジンを使うことが重要である。よって、MTを導入するときは1つのエンジンではなく、多種導入することが大切。テクノロジーはどんどん進むため、新たなものが出た場合すぐにそちらにシフトできる体制が必要である。また、PEが重要といわれているが、十印ではPEをなくすことを考えている。そのために使えるコーパス、若しくはエンジンにかける前の作業を大切にしている。

最後に

MTの波に乗るか乗らないか決めるときである。使えるのか、使えないのか?ではない。ツールは最初から100%ではない。たくさんあるエンジンをパッケージとしていかに使うかを考えること。そして、いつでも次のツールにシフトできる状態にすること。さもないと波にのりおくれる。
また、個人翻訳者からよく質問されるのが、「MTが発達すると私達の仕事はなくなるのではないか?」であるが、今のところそれはない。MTの導入によって翻訳自体が増えるため大丈夫と考えている。

 

共有