NMT みんなで使ってみました
10/26 Track3 10:00-11:30
パネリスト:
奥山 尚一 Okuyama Shoichi
日本知的財産翻訳協会(NIPTA)理事長、久遠特許事務所代表弁理士
宮本 伸也 Miyamoto Shinya
日本ビジネス翻訳株式会社 代表取締役社長
湯浅 豊裕 Yuasa Toyohiro
WIS知財コンシェル株式会社 翻訳事業部、日本知的財産翻訳協会(NIPTA)理事
平林 千春 Hirabayashi Chiharu
平林特許・翻訳事務所 特許翻訳者/弁理士、日本翻訳者協会(JAT)理事
梶木 正紀 Kajiki Masanori
株式会社MK翻訳事務所 代表取締役
新田 順也 Nitta Junya
翻訳者、色deチェックなど翻訳マクロ開発者、Microsoft MVP for Office Apps and Services受賞者
河野 弘毅 Kawano Hiroki
機械翻訳コンサルタント、ポストエディット東京代表、JTFジャーナル編集長
報告者:小野 郁子(株式会社知財コーポレーション 翻訳コーディネーター)
本セッションでは、特許翻訳におけるNMTの実用性の研究について、全7名の登壇者が発表を行った。
NIPTAの活動と特許機械翻訳研究会の紹介(奥山尚一氏)
日本知的財産翻訳協会(NIPTA)の活動には、知的財産翻訳検定の実施、ジャーナルの発行、セミナーの開催、研究活動等がある。(Webサイトはhttp://www.nipta.org)
特許翻訳者は技術翻訳と国際的ルールの両方をマスターする必要があるが、優秀な翻訳者は慢性的に不足している。翻訳者にとっても発注者にとっても基準あるいは目標となるものがあることが望ましいため、知的財産翻訳検定が始まった。特に、一級合格はプロとして独立している証とも言えるため、営業の材料としても使える可能性がある。検定の詳細についてはWebサイトで確認することができる。
2016年11月、Googleが日本語のNMTをアップし、ネット上で騒ぎとなった。これを受けて、2017年10月に特許機械翻訳研究会を発足させ、NIPTA、JTF、JAT、ソフト開発者にも声をかけ、NICT、JAPIO、JST等からもゲストを招き、NMTは使えるのか、どう使うのかを考えながら、一年間NMTを研究してきた。その結果をこれから報告する。
参考文献:中澤敏明「機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理」(論文)、新井紀子「AI vs. 教科書が読めない子どもたち」、松尾豊「人工知能は人間を超えるか」
技術分野別NMT特許翻訳評価分析
1.電気・電子工学分科会(宮本伸也氏)
知的財産翻訳検定の過去問題に対して3社のNMTを使用し、実用性評価・分析結果を行った。いずれも自然で流暢な文章であり、読み易さにおいてはSMTより格段に進歩していた。実用性の観点からは、各社とも品質面の安定性における問題が散見され、出力結果に大差は無かった。現時点では、成果物に対してはPostEditが必要であり、その作業は用語や表現の統一、未訳やフローティングの検出等、項目化して進めることが望ましい。
NMT開発者側への提言:フローティング・脱訳については注記や警告が出ると便利である。品詞指定が出来る用語登録オプションがあるとNMTの翻訳品質を向上させられるのではないか。
翻訳業者側への提言:NMTをツールとして上手く取り入れることで、より質的な面に注力して翻訳することができるのではないか。例えば日英翻訳では、ネスト構造文を避ける等のPreEditを行うことで、NMTの翻訳品質が向上しPostEdit作業量も軽減される可能性がある。
近い将来、翻訳はPostEditを中心とした業務となり、人手で付加価値を付けるようになるかもしれない。MT以上の高品質さが無ければ競争力を失うと思われる。また、適正な市場価格の形成なくしては、PostEditorの確保・育成等はいずれ立ち行かなくなるだろう。
技術分野別NMT特許翻訳評価分析
2.機械工学分科会(湯浅豊裕氏)
知的財産翻訳検定1級の過去問題をNMTにかけてみた結果、1級に合格できる品質ではないが、ツールとして利用することは可能であった。
翻訳結果では、概して流暢に翻訳されており、読み易くチェックがし易かった。一方で、訳語の揺れ、脈絡のない語の出現、訳抜け等があり、PreEdit/PostEditで対応する必要があることが分かった。また、技術を理解していないと翻訳できない箇所については苦手なようであった。
NMTの補完には、CATツールが有用と思われる。例えば、原文の長文を短文に分割し、NMTにかけた後、訳文を組み立てる、というような作業ができるCATツールを一緒に利用すれば、翻訳エラーの確率を低くできる可能性がある。今後開発・発表されるであろう、PreEdit/PostEditの機能を持つツールやソフトを上手く活用できればよい。
技術分野別NMT特許翻訳評価分析
3.化学分科会(平林千春氏・梶木正紀氏)
2018年4月、NMTエンジン3種を利用し、英和は知財翻訳検定試験第15回を、和英は知財翻訳検定試験第22回を翻訳対象として、翻訳の評価を行った。評価手法は、全13種の評価項目に基づき、①各評価者が、機械翻訳された各セグメント中に何個ミスが含まれるかを評価項目ごとにカウントし、②全評価者の評価結果を平均する、というものである。
長所は、訳文自体は概ね読み易いこと、仕事でそのまま使えるレベルではないが全体的に上手く訳せていること。短所は、クレームの訳出、ピリオドを含む略語、単複の見分け、用語の統一、化合物名の訳出、等が苦手と思われること、フローティングがあること、等。PreEdit/PostEditで工夫しながら使えば機械翻訳を活用できると思われた。(平林氏)
MT使用時はCATツールを使うと効果的。MTは作業を10~20%程度軽減してくれるものだと割り切り、残りは人間が頑張ればよい。AI等を使えば軽減率は25%程度に上げられる可能性がある。(梶木氏)
NMTを翻訳者の秘書にする
~「NMTの間違いを指摘する」ツールを開発~(新田順也氏)
NMTでは様々な誤訳が発生するが、適切なツールを活用すればNMTをもっと活用することができる。PreEdit/PostEditで使える訳文を増やし、NMTの利用が困難な文章の翻訳や文脈を考慮した訳文の作成は人間が担当する、という役割分担ができればよい。
以上を踏まえ、NMTは誤訳をする、という前提で新しいツール「GreenT(グリーンティー)」を開発した。主な機能は、PreEdit/PostEditの支援、用語の統一、QAツールによる訳文チェックである。さらに、複数エンジンによる訳文を相互に比較することもできる。
ツールは人間を代替するものではなく、人間の能力を引き上げてくれるもの、と捉えて活用すれば、PreEdit/PostEditがし易くなる、PreEdit/PostEditのノウハウを蓄積できる、用語の統一・英数字記号の誤記の発見がし易くなる、等々のメリットが得られる。
GreenTは2019年1月公開予定。翻訳メモリや各種翻訳エンジンと連携させることで、より便利になる。
翻訳業界はNMTにどう対応すればよいか(河野弘毅氏)
JTFジャーナル11/12月号にて、特許機械翻訳研究会の研究成果の特集記事が掲載されるのでぜひ確認して頂きたい。
本研究が目指すものは、MTの現在の能力を知り、今後の能力を予想して自分の仕事に役立てることである。MTには未熟な点もあるが、コーパスを充実させること、アダプテーションを行うこと、新しい翻訳支援ツールと連携すること、等により今後改善されていくと思われる。とはいえ、現時点でのMTの翻訳品質はそのまま産業翻訳で利用できるレベルではない。
生産性を上げるためには、翻訳品質の品質保証工程にMTの工程を組み込む必要がある。例えば、品質保証のうち、流暢さはMTで、正確性は人間翻訳で、統一性はQAツールでそれぞれ担保すればよい。人間と機械がそれぞれ得意な役割を分担するため、人間の仕事はなくならず、また、生産性も大きく向上するのではないか。
ただし、MTを道具としてフル活用できなければ生産性を上げることは難しいため、MTの性能の向上度合を継続的にモニターする、MTのフル活用方法を習得しておく、等の対策を取る必要がある。翻訳業者が脅威に思うべき相手は、このような対策をとっている競合業者であると思われる。
参考文献:古瀬幸広、広瀬克哉『インターネットが変える世界』岩波新書
質疑応答
Q1 PreEditで長文を短文に分割する場合の「長文」とは大体何文字を想定しているか?
A1 40~50文字が読み易く、150~200文字は長いと思われる(湯浅氏)。GreenTでは文字数を設定してアラートを出せるようになっている(新田氏)。
Q2 PreEditで原文を修正して翻訳する場合、発注側は何を原文として管理すべき?
A2(将来的には)PreEditでどこを変更したのか履歴を残し、発注側の原文と齟齬が出ないように管理する運用が必要。発注側は特に気にする必要は無い(宮本氏)。
Q3 GreenTの価格は?無料での提供はあるか?
A3 価格は未定。月額制になる予定。無料エンジンを用いるとデータの漏洩に繋がるので有料エンジンを用いており、そのため有料ツールになる(新田氏)。