第11回AAMTセミナー 『翻訳ワークフローにおけるNMTとLLMの活用 ~LLMのインテリジェンスとそれを用いた自動ポストエディット~』
NTMとLLMによる自動ポストエディット機能を搭載した翻訳支援ツールにを使用した新しい翻訳ワークフローをご紹介します。
■講師
内山 将夫氏(AAMT副会長・情報通信研究機構 先進的翻訳技術研究室 室長)
本間 奨氏(日本特許翻訳株式会社 代表取締役)
司会:中澤敏明 (AAMT理事・東京大学)
■日時
2024年9月19日(木)14:00~15:30
■実施形式
Zoomオンライン、講演後2週間のオンライン配信
■参加費:
- 会 員 :3,000円(不課税)
- 学生会員 :1,000円(不課税)
- 非 会 員 :5,000円(税込み)
- 非会員の学生:2,000円(税込み)
■概要
第1部
コーパスベースの機械翻訳の発展として、EBMT →SMT →NMT →LLMへの流れがあることを解説します。
第2部
翻訳ワークフローにおける、NMTとLLMの役割分担について説明。NMTはLLMと比べて専門翻訳に強く、また、オンプレミスで稼働したときのコスト・スピードに優れています。そのため、LLMにより、従来の機械翻訳の機能を置き換えるのは、コストが高く、オーバースペックで、かつ精度的な優位さも少ないです。一方、NMTを活用しながら、LLMが、従来のNMTでは対応できていない、
1)訳揺れ、2)用語ベース不一致、3)湧き出し、4)訳抜け、5)数字や記号・空白・句読点の誤り、6)インラインタグ不正を自動ポストエディットすることが可能となってきました。
これにより、近い将来、翻訳ワークフローにおいて、NMTに加えて、LLMによる自動ポストエディット機能を搭載した翻訳支援ツールにより翻訳のワークフローが大きく変わってくると予想されます。
第3部
LLMのチューニングの具体的な例として、Meta-Llama-3-70B-Instruct を継続学習するスクリプトを解説。また、特許英日専用の機械翻訳エンジンとしてのLLMを、みんなの自動翻訳@TexTraの特許NT英日と少し比較してみます。
■講師プロフィール
内山 将夫氏
情報通信研究機構 先進的翻訳技術研究室 室長
日本語に関係する世界最高精度の自動翻訳エンジンを構築し、それを世の中に普及するための研究開発に従事している。現在、情報通信研究機構の自動翻訳エンジンの開発を指揮しており、2014年6月に、みんなの自動翻訳@TexTraを公開し、2017年6月には VoiceTraにニューラル自動翻訳エンジンを導入した。1997年3月、筑波大学大学院工学研究科修了、博士(工学)。現在、情報通信研究機構 先進的翻訳技術研究室 室長。
本間 奨氏
日本特許翻訳株式会社 代表取締役
東北大学理学研究科 物理第二卒 理学修士(量子現象を用いた半金属合金の電子構造解析)
日本発明資料にて語順変換統計的機械翻訳エンジンを用いた英日・中日翻訳システムMT Plusを開発、特許庁中国実案抄録翻訳事業に採用され、現在100万件以上J-PlatPatで利用されている。 2015年2月、日本特許翻訳株式会社を設立、大手翻訳会社、大手企業中心に外国公報の多言語高精度機械翻訳サービスを提供中
■このセミナーの対象
- 機械翻訳を実務応用したい(している)翻訳会社
- NMTやLLMを実際に使って翻訳しているユーザー
- NMTやLLMを研究している技術者、研究者、学生
- 機械翻訳の今後の展開に興味がある翻訳者、関係者
■参加登録
以下のサイトからお申し込みいただけます(Peatixに接続)。
https://aamt-seminar-11.peatix.com/