個人翻訳者の視点で"CAT"ツールを比較する
翻訳者、JTF副会長 高橋 聡
はじめに
ジャーナル編集部から依頼されたのは「翻訳ツール比較」でしたが、「翻訳ツール」とはいわゆる「翻訳支援ツール」を指すものと理解しました。具体的には、デスクトップアプリケーション版として「Trados Studio」と「memoQ」、クラウドアプリケーションとして「Phrase TMS」「XTM」を扱いますが、総論のなかではそれ以外のツールも念頭に置いた場合があります。ところで、今わざわざ「いわゆる」という枕詞を付けたとおり、私自身は「翻訳支援ツール」という用語がいろいろな誤解のもとだ(むしろ誤訳に近い)と考えているので、本稿では本来の英語から「CATツール」を使うことにします。
また、最初から各ツールを比較するのではなく、機能ごとに総論を述べたうえで、明らかに機能差や優劣があるときだけ具体的にツール名を示す、くらいの方針にしようと思います。今回取り上げたのは、翻訳者つまり「実際の翻訳にCATツールを使う作業者」として私個人がCATツールで重要と考える主な機能です(紙面が許せばもっといろいろ出てきます)。
1.TMルックアップのロジックと精度
2.訳文検索(いわゆるコンコーダンス検索)機能
3.訳文を登録したときの挙動
4.用語集(タームベース)の精度
5.検索/置換とフィルター
6.QA機能
7.翻訳後のエクスポート機能
8.全体的なインターフェースとその使いやすさ
1.TMルックアップのロジックと精度
ここがCATツールの要であることに異論はないでしょう。完全一致はいいとして、ファジーマッチ範囲にある既訳をTM(翻訳メモリー)から探し出して有効に使う機能は何より重要なはずだからです。CATツールの登場から四半世紀以上たつのですから、ここのロジックはそろそろ統一的に進化していてもよさそうなのですが、現実にはなかなか進んでいないようです。似たような原文を見た記憶がある、つまり一定以上の率でマッチする既訳があるはずなのにそれが候補として出てこないことは、今でも珍しくありません。もちろん、最低マッチ率を一定以上に高く設定してあってもです。
既訳とのマッチ度を解析するロジックはツールごとにかなり差があるらしく、それなりに一致する部分があっても、解析・計算した値が最低マッチ率に満たないと判断されてしまうようです(逆に、本当のマッチ率より高く計算されてしまったら、それはそれで困ります)。ツールごとのロジックの癖といってもいいと思いますが、原文がどんな状況のときにどのくらいの既訳候補が示されるかを観察していると、その癖や限界がだんだん見えてくるはずです。ツールを使いながら把握していきましょう。
Trados Studioのルックアップはさすがに安定していますが、ルックアップ結果を信用できないCATツールの場合は、ファジーマッチ候補が出てこないときでも疑ってかからなければなりません。ルックアップ機能が不十分な場合は、それでもなお既訳を部分的に再利用できるように、次項のコンコーダンス検索(既訳の部分的な一致を検索する機能)が重要になってきます。
2.訳文検索(いわゆるコンコーダンス検索)機能
既訳の候補が表示されなかったとき、すぐに新規箇所として翻訳し始めるか、それとも念のためにコンコーダンス検索を実行するかは、翻訳者の経験や姿勢で違うかもしれません。前項で書いたようにルックアップのロジックと精度が不十分な場合は、コンコーダンス検索をまめに実行したいところですが、ここは業界プラクティスが統一されていない点です。
前項と同じく、コンコーダンス検索で既訳の一部が見つかるかどうかも、実はCATツールによってかなり違います。この機能については、Trados Studioがだいぶリードしています(それでも完全ではないので、私は必ずテキストにエクスポートしてそちらも検索するようにしています。ところが、この回避策が特にクラウド系では使えません)。それ以外のツールでは、意外なほど部分的な既訳が見つからないことがあります。以下のようなケースです。
①複数単語の連続が優先的に検索されない(いちいち引用符で囲む必要がある)。
②語形の違い(名詞の単複や動詞の変化)があるだけで見つからない(ワイルドカード機能が用意されていることもあるが、それでは対応しきれない)。
③二単語かハイフンつなぎか(たとえば、AI aidedかAI-aided)の差があるだけで検索できない
最もアテにしたい機能にもかかわらず、遺憾ながらほぼどのツールでも進歩が見られません(ちなみに、ハイフンつなぎの語をコンコーダンス検索すると、ハイフンだけがヒットする場合さえある)。こういう限界があると、引用符を付けたり、選択する範囲を変えたりしながら何回かコンコーダンス検索を試みなければ部分的な一致は見つからないことになります。訳文の不統一を生み出す大きな原因になっているのではないでしょうか。
3.訳文を登録したときの挙動
ごく初期のTradosでは、100%既訳が存在する原文に対して別の訳文を登録すると、元の既訳は上書きされて完全に消えてしまいました。つまり、100%既訳は1つしか登録できない仕様だったということです。さすがにそれは不便だ(訳し分けができない)ということで、同じ原文に複数の訳文を登録できるようになりました。ただし、そのときは登録時にフィルター条件を付与するなどして100%ではなく99%以下のマッチとして登録する(ペナルティを設定する)というのが業界プラクティスでした(私の知る限りは)。しかし、さすがにそれは煩雑と思われたのでしょう、たいていのツールでは100%一致を複数登録できるようになって今日に至ります。同じ原文に対して複数の訳文を登録するならペナルティを設定すべきなのですが、その辺の運用プラクティスが統一されていないせいか、100%訳がいくつも登録されているTMが当たり前になってきました。これも、CATツールの運用現場に大きな不幸を生んでいます。
4.用語集(タームベース)の精度
タームベース(TB)でも、TMと似たような、しかしちょっと違う症状が見られます。語形の違いだけでTBの用語がヒットしないCATツールもあって、これでは容易に訳語の不統一が生じてしまいます。TBを作る側にも問題がありそうで、たとえば複数系のpracticesだけが「プラクティス」として登録されていて、単数形practiceが所定の用語として示されないことがあります。こういうときは、「あいまい一致」する用語として表示されるべきでしょう。これは逆に、identityとidentifyのように訳語がかなり違う単語のペアについてはなぜかあいまい一致が機能して、要らない訳語が表示されたりします。
つまり、TBに関しては「あいまい一致」が、必要な部分では機能せず、要らない部分で機能しているわけです。しかも、あいまい一致機能のオン/オフは見当りません。この症状に関しては、遺憾ながらどのCATツールも五十歩百歩というところです。正規表現などを組み込んでもっと精度を上げることはできそうです。これだったら、用語集をExcelリストで支給されたほうがまだマシでしょう。
5.検索/置換とフィルター
検索と置換は、文字入力を伴うソフトウェアでは特に充実しているべき機能だと思うのですが、それが未成熟なCATツールもあります。デスクトップアプリケーションはおおむね大丈夫です。ただしTrados Studioでは、原文と訳文のどちら側を検索するかが、カーソルの位置によって自動的に判断されます。親切設計なのでしょうが、これが意外と邪魔だったりします。この点に限っては、memoQのほうが扱いやすくできています。
一方、クラウドアプリケーションは全般的に検索機能が使いにくい傾向があります。ブラウザー上の検索機能との使い分けが難しいからかもしれません(それ以外にも、クラウドツールではブラウザーベースゆえの限界がいろいろある)。そのせいもあってか、いち早くクラウドで出発したPhrase TMS(かつてのMemsource)は、フィルター(絞り込み)機能が優秀です。原文側と訳文側のフィールドがウィンドウの上部に常に表示されているのですぐに使えますし、検索オプションもひととおり揃っています(大小文字の区別、正規表現など)。同じクラウド系でも、XTMのフィルターは、他の絞り込み機能と同じウィンドウの中にあるので、残念ながら最も使いにくい印象です。
デスクトップ系では、memoQのフィルター機能がPhrase TMSとほぼ同等です。原文側と訳文側のどちらにもすぐ入力でき、オプションも十分に用意されています。Trados Studioは、いちいち[レビュー]タブに切り替えなければならず、しかも入力フィールドが1つしかない――原文側と訳文側をいちいちボタンで切り替えなければならない――ので、使い勝手がだいぶ劣ります。
フィルターは、用途によっては便利な機能ですが、こちらがどんなに優秀でも検索機能が貧弱だと困ります。フィルターで絞り込んだ状態では、該当するセグメントしか見えず、前後の文脈が見えないからです。
ところで、Trados Studioの検索機能でいちばん残念なのは、連続検索したときの挙動です。Wordなどのメジャーなソフトウェアはもちろん他のCATツールでも、連続検索したときって、ヒットした位置がすぐにアクティブになる、つまり編集可能状態になるのが普通ですよね? ところが、Trados Studioではヒットしたセグメントをいちいち(クリックして)アクティブにしないと、そこが編集状態にならないのです。検索しながら修正していきたいことって多いはず(一括置換が不向きの場合など)なのに、この点は一向に変わりません。
6.QA機能
翻訳が終わってからいろいろな点をチェックする、いわゆるQA機能がたいていのCATツールに用意されています。その挙動と精度はツールごとに差があり、どのCATツールでも少しずつ改善は見られます。しかし、率直にいうと「どれもFalse Positiveだらけになってしまって実用性が著しく低い」という現状は、この四半世紀の間まったく変わっていません。
特にひどいのが、「数字の不一致」と「指定用語の不使用」です。たとえば、firstを「1番目」、Januaryを「1月」と訳した箇所はすべてエラーになることが、(日本語を扱う)翻訳者には広く知られています。いまだに、CATツールすべてがこの有様です。おそらく、序数や月の名前を翻訳するとき、ヨーロッパ言語どうしなら数字は出てこないからではないでしょうか(日本語環境の優先度はすっかり低くなってしまいました)。用語については、TBで指定された訳語を使っていない場合がエラーになります。ところがこの機能もほとんどのCATツールがお粗末です。まず、部分一致の問題。たとえば、「lock=錠」という用語がTBで指定されている場合に、block「ブロック」という翻訳がエラーになったりします。部分一致する「lock」の訳語「錠」が使われていないからです。同様に、語形の差などが考慮されずやはりエラーになります。このくらい、正規表現などのロジックを組み込みさえすれば簡単に解決できるはずなのですが、どのCATツールでも改善の兆しが一向に見られないのは、なぜなんでしょうか。
結果的に、どのツールでも翻訳者は大量のFalse Positiveを見せられ、その一つひとつに「エラーではない」というフラグを立てなければなりません。それが当然のように考えられているのも、翻訳業界の大きな問題です。memoQには、同じ種類のエラーを一括してフラグを設定する機能がありますが、そうなると今度は、「False Positiveが多すぎるので、すべてをきちんと確認などしていられない」となり、QA機能の意味が半減してしまいます。
7.翻訳後のエクスポート機能
この機能の重要性って、業界ではどのくらい認知されているのでしょうか。私はとても大きいと思っています。翻訳が終わってから、機械的に済ませられるチェック(Just Rightなど)を実行するのに不可欠だからです。これがいちばん簡単なのはTrados Studioです。エクスポートするまでもなく、訳文側を一括選択してコピーできるからです(原文側でも可能)。ツール上で簡単に一括選択/コピーできるこの機能、とても便利だと思うのですが、ほかのツールではまったく見かけません。技術的に難しいのでしょうか。もちろん、バイリンガル形式が必要ならDOCX形式でエクスポートできます。memoQでは、バイリンガル形式のRTFファイルをエクスポートできます(CAT業界標準のXLIFFも可)。Phrase TMSでもバイリンガル形式のDOCXをエクスポートできますが、クラウドツールの場合、ファイルがかなり大きいとうまく動かないことがあります。XTMは、なぜかエクスポート形式がExcelファイルです。
8.全体的なインターフェースとその使いやすさ
最後の項目ですが、作業者にとっては効率に直結するとても重要な要素です。インターフェースの使い安さは、ある程度まで歴史の長さに比例するようで、デスクトップアプリケーションのほうが全般的に優秀です。Trados StudioとmemoQは、どちらもさすがに使いやすく配慮されています(好みは分かれます)。もちろん両者で細かい違いはあって、ひとつだけ書いておくと、memoQには「訳文を登録してセグメントを移動しない」機能がありません(移動するかしないかを設定で切り替えるだけ)。個人的には、これが地味に不便です。
Phrase TMSも、クラウド系の老舗だけあって現行のインターフェースに大きな問題はほぼなさそうです。ことインターフェースに関していちばん辛いのは、残念ながらXTMです。次のセグメントに進むだけで訳文が確定・登録されるのは便利かもしれませんが、コンコーダンス検索や用語検索などの勝手がほかより一歩見劣りします。何より不便なのは、セグメント数が一定を超えているとき、ウィンドウのいちばん下(または上)まで進んだときいちいち読み込みが発生する点です。
Phrase TMSは、クラウド案件であってもデスクトップアプリケーションでアクセスできる仕様なので、クラウドとデスクトップの両対応という点では、Phrase TMSがかなりリードしています。memoQにもクラウド版はあり、使い勝手はデスクトップアプリケーションとほぼ同じです(ただし、足りない機能ももちろんある)。Trados Studioも少し前のバージョンからクラウド対応しました。こちらもインターフェースはできるだけ近く作られていますが、実際の運用現場ではどのくらい普及しているのでしょうか。デスクトップアプリケーションの老舗だった分、逆にクラウド対応では一歩後れをとっている印象です。
インターフェースのカスタマイズ性がいちばん高いのは、やはりTrados Studioです。ウィンドウの配置、フォントサイズの変更など自由度が高くなっています。クラウドアプリケーションはカスタマイズの自由度がどうしても下がってしまいますが、これはおそらく手軽さとのトレードオフなのでしょう。今回取り上げなかったクラウドCATツールのなかには、表示フォントすら変えられないものもあります。
カスタマイズ性といえば、ショートカットも見逃せません。作業の効率化では自分に合ったショートカット設定は欠かせないからです。Trados Studio、memoQ、XTMともショートカットはおおむね可能です(設定できる機能には多少の差がある)。Phrase TMSのショートカットは、デスクトップアプリケーションなら変更できるのに、クラウド版では変更できません。これは残念です。
おわりに
CATツールは、以前よりだいぶ手軽に使えるようになりました。主な操作には共通点も多いので、通りいっぺんに使うだけならあまり差はないかもしれません。しかし、細かい挙動や設定はツールごとにかなり違うので、その特性を十分に理解してから使わないと、CATツールを使う意味が半減しかねません。特に、容易に不統一が生まれてしまう現状は、翻訳者の考え方しだいでだいぶ回避できるはずです。
結果的に、いろいろと文句のような書き方も多くなってしまいました。この文章、せっかく日本翻訳連盟のジャーナルに載るのですから、各CATメーカーの方の目にとまるとうれしいですし、そのうえで機能改善につながるなら願ったり叶ったりです。
○執筆者プロフィール

高橋 聡(たかはし あきら)
CG 以前の特撮と帽子と辞書をこよなく愛する実務翻訳者。
翻訳学校講師。日本翻訳連盟(JTF)理事・副会長。学習塾講師と雑多翻訳の二足のわらじ生活と、ローカライズ系翻訳会社の社内翻訳者生活を経たのち、2007 年にフリーランスに。
現在は IT、マーケティング、ニュースなどの翻訳を手がける。
訳書に『機械翻訳:歴史・技術・産業』(森北出版)、『ChatGPTの頭の中』(ハヤカワ新書)、『ハッキング思考』(日経 BP)など、 著書 に『 翻訳 者の ため の超 時短 パソ コン スキ ル大 全』(KADOKAWA)。