覆面座談会 翻訳者から見たMTPEの現在と未来(前編)
産業翻訳の分野を中心に翻訳の現場で急速に広がるMTPE(機械翻訳ポストエディット)に対して、翻訳者はどのように感じ、いかに向き合おうとしているのか。翻訳者としてのスタンスにも関わるMTPEとの付き合い方について、本特集では、覆面座談会の形で忌憚なく意見交換をしていただきました。今回はその前編です。
サトシさん:個人翻訳者および今回のモデレーター。MT(機械翻訳)はいろいろな会社が実験的に使っていたころから付き合いがあり、PE(ポストエディット)もテスト段階を見てきたが、今は個人的にPEは請け負っていない。MTの精度は今も常に追っている。一方、生成AIには世話になっている。
タケシさん:個人翻訳者。MTPEはやらない。
ミサトさん:個人翻訳者。MTは基本的には使ってない。
ハナコさん:社内翻訳者。MTは積極的には使わないが、使ったことはあり、条件によってはいやではない。
ハンベェさん:翻訳会社勤務、社内翻訳者。MTは積極的に使っている。
ジョジョさん:JTFジャーナル編集部からオブザーバー的な立場で参加。
●MTの使い勝手と運用コスト
サトシさん:本日は、産業翻訳者のみなさんにお集まりいただいて、機械翻訳(MT)やポストエディット(PE)について、現在の使用状況、感じているメリットとデメリット、今後の付き合い方などについてお伺いしたいと思います。
まず、みなさんにMTを使っていない理由、使っている理由あたりからお聞きしたいと思います。ハナコさんは、以前は会社で使っていて、今使わなくなったんでしたね。その経緯を伺っていいですか?
ハナコさん:最初は3年ぐらい前ですか。翻訳祭でMTの話題が盛り上がったときに上司から、「今、機械翻訳が話題になっているし、それで成果が上がれば自分たちのアピールにもなるから、ぜひ使ってみてほしい」と言われました。「使ってみて、翻訳がおかしいと思ったら好きなだけ直してよい」、「使えるレベルかどうか評価までしてほしい」ということだったので、やってみました。
あるMTを使って、取説(取扱説明書)とサービスマニュアルの2本立てで翻訳をしたところ、取説は使えるところと使えないところがありました。MTによる翻訳は言葉の置き換えでしかないので、原文(日本語)にないものは当然翻訳されないし、文の流れが無視されてしまうので、“いかにも機械翻訳”という感じの仕上がりになりました。代名詞なども曖昧になってしまうし、変な訳も多かったので、「7~8割は直しました」という報告しました。原文の質があまり良くなかったせいもあると思います。
それでも今後使ってほしいと言われて、次の年に同じ会社が提供する新モデルのMTを使ったんですが、機械翻訳としての精度は上がったけれど、少し不親切というか、前のモデルと違ってデータベースのようなものを自分では作ることができない仕様になっていました。もし必要であれば別料金が発生する、というような感じで、MTだけを販売するのではなく、オプション部分で継続的な売上を確保していこうと考えているように見受けられました。
最初のMTは私たちが一度使ってカスタマイズしたものに合わせてデータベースの内容を増やしていけるけれど、新モデルのほうは、導入した後、どれだけMTの精度が上がっていくのかは私たちにはわからない、同じ日本語を入れても次回は違う訳が出てくる可能性もある。使いたい用語集も指定できない。データベース的なものを作るにも何十万円とかかり、データベース自体は中身が増えていかない。
上司には「旧モデルも新モデルも、翻訳の精度としてはあまり変わらない。新モデルについては、自分の力で管理ができない分、かえって大変になってしまう、翻訳支援ツールも一緒に導入しないと効率が悪い」と報告したら、「そこまではやらなくていい」と言われ、最終的には「やめましょう」ということになりました。結局、上司としてはちょっと流行に乗りたかっただけだったようで、「結果があまり良いものじゃないなら、人間が翻訳したほうがいいね」ってことになっています。
ただ最近は、社内の若手の中にはChatGPT(生成AI)を使っている人たちが出てきたので、またちょっと違う傾向が見られているようです。
サトシさん:今、具体的にソリューションを売っている会社の話が出ましたけど、たしかにMT開発運営会社がどういう商売をしているかというのは、あんまり私たちの耳に入ってこないんですよね。一度売って、それをわざとではないんだろうけど、満足に結果が出ないものにしておいて、「もっと精度を上げるにはお金かかります」というような売り方をするって、にわかには信じられない話ですが。
ハナコさん:今まで現場でいろいろな翻訳支援ツールを使ってきたり、機械翻訳がどんなものかを知っている人は、「こう活用すればうまくできる」とか、「使えない」といった判断ポイントみたいなものがわかると思うんです。でも、どんなものかをよく知らない役職者など現場以外の人たちは、「必要ならお金払おう」となるから、結局お金を払っても精度の良いものを得られていない。また、全然評価ができていなくて、「なんか英語になってるからいいや」となって、いまだによくわからないまま使っている人もいるみたいです。
サトシさん:今まで翻訳支援ツールもいろいろ使ったことがあって、MTもそれなりに研究している大きな翻訳会社などなら、そういうソリューション提供会社の商売に乗って相談していく中で有効に使えるのかもしれないけど、顧客側にそういう知識がなかったらいいようにされてしまうかもしれませんね。
ハナコさん:たぶん特許や医療など、業界によっては、もっとうまく使えるのかなと思います。
サトシさん:分野的に合わない感じでした?
ハナコさん:そうですね。日本語の質が悪い社内資料には全然使えないかなという評価です。でも分野によっては使えるのかもしれません。
サトシさん:導入しても使えなかったという話は、機械翻訳が、まだルールベース機械翻訳(RBMT、RMT)の時代には山ほど聞いたんです。現在主流のニューラル機械翻訳(NMT)になってからは、「わりといい」という話しか聞こえてこなかったけど、今のお話のように「具体的にやろうとしたけどダメだった」という例がまだまだあるということですね。結局導入しようと思っている側の規模による気はしますね。
ハナコさん:あとは、評価できる人がいるかいないかも大きいと思います。
サトシさん:今のケースは社内運用で、単価に反映されないから、フリーランスが今けっこう困ってるPEの問題とは、またちょっと違いますよね。
ハナコさん:やっぱり単価が決まってなくて、社内翻訳者として、作業した分はすべてお金がもらえるからやれる。その点は大きいと思います。
サトシさん:業界全体としては、まだうまくいかないケースがある。それから言葉は悪いけど、そういうところにつけ込みがちな商売があるんじゃないかという疑惑。これはすごく大きいですね。
●「とりあえず日本語になっている」怖さ
サトシさん:全くMTを使ってないというミサトさんは、試したこともないですか。
ミサトさん:そもそも私が使ってない理由は、ほとんどが翻訳会社経由の取引で、翻訳会社がMTの使用を禁じているからです。
ただ最近、別の経由でちょっと大きめの仕事があったんですが、原文が全部ネットに出ているもので、その仕事を依頼してくれた会社とはMT禁止の契約もしていなかったので、ここ2、3週間試しに使ってみました。英日翻訳ではなかったんですけど、使った感想としては、たぶん英語でもそうだと思いますが、まず用語の統一が図れない。特殊な内容ということもあって決まった用語を使わなければいけないときに、1行ごとに違う単語で訳されてきてしまう。結局、それを直さなければいけないので、あまり効率的ではないなと思いました。
サトシさん:それは合っていない用語だけ置き換えればいいという問題でもなくて、違う用語に訳されてきたら、それに合った文脈になっているでしょう? そうしたら全面的に書き直しになりますよね。
ミサトさん:そうなんです。それで、かなりタイトな仕事ということもあって、出てきたものをうっかりそのまま採用したくなる気持ちが芽生えてしまうのがすごく怖いなと思いました。
かなり昔のことなんですけど、ニューラル機械翻訳が出てくるずっと前に、ある会社から、暗に機械翻訳を使っていいからという含みで、「年度末までにとりあえず日本語になっているものを一回納品して、後できちんと訳して出してほしい」と言われたので、MTを使って出したことがあります。そのときは、訳文に英語も混ざっていたのでそこだけは除いたんですけど、パッと見、これでいいかなって思って「出しちゃおう」と思えば出してしまえる。「何でもいいから横を縦にして出せ」と言われたときに、「とりあえず日本語になってるから、それでいいや」という無責任さが自分に生まれるのがすごく怖いなと思ったことがあります。
サトシさん:そうなったら終わりですよね。
ミサトさん:そうなんですよね。特に今、ニューラル機械翻訳になってすごく自然な文章が出てくると一瞬安心してしまうけど、よくよくつき合わせてみると平気で一部が抜けていたり、自然だけど意味がそもそも全然違っていたりということがあって、人間がやったものをチェックするよりも負荷が大きいです。
サトシさん:人間が訳したもののチェックと違って、負担が重いのはなぜなんでしょうか。
ミサトさん:人間の翻訳のチェックだと、訳した人のパターンがある程度つかめてくるんですよね。この人はこのぐらいのレベルだなと判断がつけられる。この人はきちんと用語を調べているなとか、読みながら勘が働くので、チェックの際に気をつけるところと、気を抜けるところの調整がしやすい。
けれど、MTPEだと、すごく完璧な文章が出てくるときもあるけど、20%しか当たってない文章が次の行に出てくることもある。結局、すべてが間違っているという前提で見ていかなきゃいけないので、すごく負荷がかかるんですよね。
私はCATツール(翻訳支援ツール)もあまり使っていないんですが、特許とか医薬の一部の文書はすごくパターン化されているので、CATツールでうまくはかどるメモリが多いような文章であれば、MTを使ったときに基本的に精度が高いものが出てくるだろうなと思います。でも、それもたぶん文章によると思います。今回3週間試しにやってみて、もちろん役立つ部分もあったけれど、負荷がすごくかかるなと思いました。
サトシさん:さっきハナコさんの話にもありましたが、取説はわりとうまくいくことがあると。
ハナコさん:それでだいぶうまくいくものもあったんですが、「機械翻訳だからこんなもんでいいか」みたいにチェックをしていくと、だんだん正しい翻訳が何だかわからなくなる。手の打ち所というか、妥協点がどんどんおかしくなってくるという感覚はすごくありました。
サトシさん:分野でいうと、ITのマニュアルはCATツールでもある程度成功したし、その流れでMTも使えている。たぶん今、一番MT化されているのはそこだと思います。ある程度蓄積もあって、用語なども指定できるエンジンならたぶんPEの負担がけっこう軽くなっているし、それなりのものができあがる。そういう案件で、たとえば、「フルの単価の7~8割でPE」と言われたら、それはそれで成り立つ商売な気がします。
ミサトさんの話にあった、人の訳をチェックするよりもPEのほうが負担が大きいというのは、MTの歴史上ずっとあったんです。
昔はルールベース機械翻訳だったでしょう。ルールベースの翻訳ってとんでもないんだけど、逆に間違いのパターンがわかりやすかった。だから、そこに気をつけると、けっこううまくできたんですね。その後、統計型機械翻訳(SBMT、SMT)になったら全体の質が上がったけどもルールに基づいていないので、間違え方のパターンが見えなくなった。そして今のニューラル機械翻訳になったらもっとそうなんですよ。滑らかになるけれども、どこをどう間違えるかというパターンは全くないからゼロからスタートになる。結局、同じことを繰り返しているのかなという気がします。
●MTをめぐる業界の不均衡
サトシさん:ミサトさんがおっしゃった、個人レベルではMTは使わないというのは当然そうで、私たち個人翻訳者は使わない前提になっていますよね。
でも今、翻訳会社は自社の効率化や利益のためにMT導入を推進している。お客さんもそう。特にヨーロッパなどでは、もうそれが当たり前になっている。そうやってMTを使う商売が成り立っているのに、翻訳会社が契約している個人に対しては使うなと言っている。これってすごく不均衡ですよね。使った原文訳文のペアを取られちゃうということがなければ、個人翻訳者にも開放しないと不均衡でしょう。
ジョジョさん:今、翻訳会社でMT禁止ということでNDA(秘密保持契約)を結ぶじゃないですか。でもこれだけ便利なツールだし、私自身は使ってもいいんじゃないかなと思うんです。大学生でさえ今、大学で使っちゃいけないと言っても論文に使って提出して、先生もわからないみたいな状況ですよね。今後そういうことがどんどん増えると思います。
サトシさん:それは増えるでしょうね。
ジョジョさん:そういう意味では、翻訳会社が使ってはいけないと言っても、使う人が出てくるのは防げないと思うんですよ。
サトシさん:有料版を使うようにして、データを取られないようにしてくださいと言ったほうがいいですよね。
ジョジョさん:ある翻訳会社では、自社で医療分野のMTを構築して、これでやってくださいと提供しています。その中で使うということについては、メーカーも了承の上です。
サトシさん:ひとつのプロジェクト全体で、お客さんも翻訳会社も翻訳者もそのMTを使う。それがたぶん、一番いいモデルですよね。