Talk 1：Methods, Insights and Prospects of Empirical Translation Process Research

2015年9月6日2021年2月1日 Editor

Talk 1：Methods, Insights and Prospects of Empirical Translation Process Research

Speaker: Professor Michael Carl

（ミカエル・カール　コペンハーゲン大学教授、国立情報科学研究所(NII)外来研究員）
(Professor at Copenhagen Business School, Visiting Researcher at NII (National Institute of Informatics))

　Carl教授は、一年間、国立情報科学研究所(NII)の相澤彰子先生の研究室でEmpirical Translation Researchについて共同研究をされている。
　Empirical Translation Researchとは、翻訳プロセスの研究であり、翻訳者は何をしているのかを見るものである。

機械翻訳の歴史

・機械翻訳の歴史は、1950年代に端を発する。
・ALPACレポートにより、その有効性が否定されかけた。
・それに代わるように、日本においてルールベース型機械翻訳の研究がなされた。この研究は、翻訳研究(translation studies)と結びついている。

機械翻訳の絵について(picture of MT)

　1949年に、翻訳について大がかりな実験が行われた。
　1970年代と1980年代は、機械翻訳の研究が停滞した。
　コンピュータ処理への取り組みが低下し、1980年代には、コンピュータと翻訳の研究が統合して行われた。（文法生成のための枠組みという新しい視座）
　EUにおいて、全てのプロジェクトが、さまざまな言語間で翻訳される必要があり、そのような中、ソース文書の分析が行われるようになった。（1980年代のはじめまではひどいものだった）
　ソース文書の分析をしたうえで文書を生成。次第に、統計的機械翻訳がより評価されるようになり、機械翻訳の精度の比較尺度もできて多くのグループが結果を比較するために使用するようになった。
　ポストエディットについて：以前注目されていたのは、翻訳に対するポストエディットの質。

ALPACレポートについて

　機械翻訳はよい評価がなされず、いかに翻訳者を支援するか、どの文書を翻訳すべきか、といったことに力点をおいて述べられた。

ALPACレポートの50年(50 years of ALPAC report)の評価
　ALPACレポートの後に異なるパラダイムが生み出された。
　EUにより、翻訳評価の基準としてのQT Launch Padが打ち出される（BLEUスコアを含む）。
　一方、市場の多様化により、品質に対する期待も多用化した。
　そして、翻訳者の参考資料をよりよくする存在としての翻訳メモリ(TM)が活用されるようになる。
　こうした事象をどのように組み立てるかを考慮するのが翻訳プロセスの研究。

1980年代は、ルールベース型機械翻訳の時代

　世の中の機械翻訳の流れにかわるアイディアが生まれた。
　実践的な翻訳（pragmatic translation。）
　1980年代は、人による作業と機械との両方がとらえられた時代。

認知心理学的アプローチ（cognitive approach）

　長尾先生のご研究に基づく翻訳のシミュレーション。
　長尾先生のご研究（1984年の論文に示された分析 paper analysis
[Makoto Nagao (1984). "A framework of a mechanical translation between Japanese and English by analogy principle". In A. Elithorn and R. Banerji. Artificial and Human Intelligence (PDF). Elsevier Science Publishers.のことと推察される。相澤先生が検索してくださった。]）
　ソース文書の分析および再構成(reformulate)、ルールベースのフレームワークを用いた再構築(recompose)。
★人手翻訳の理解→翻訳→再結合(recombination)
　これをどのようにシミュレーションするか。
　2003年に考案された用例ベース型機械翻訳; Example-based Machine Translation (EBMT)では純粋にシステムを扱う。
　文法が生成され適用され、これらは関連付けられて部分的に一致させられる。

＜長尾先生の理論＞
　人は翻訳するのではない。
　人は翻訳をするという考え方は、本当の意味で、人がどのように作業しているかを説明するものではない。
　人の翻訳のプロセスをとらえ直す。

翻訳者はどのように翻訳すべきか？（翻訳しているのか？）

　翻訳研究の分類
　翻訳研究をどのように形式化するか(how to formalize translation studies)→翻訳者の行動の予想(predict translation behavior)

　1925年[この年は、著名な出版社からラテン語からの翻訳が出版されるなど翻訳にとっては重要な年であったと理解される（三宅補足）]頃から、翻訳は、一定の規範のもとに行われる活動(norm activity)であったと分析されている。
　言語を問わない翻訳の基本原理を追求することを趣旨とした“Translation universals”に、翻訳の規範についての分析の研究史とともに詳細に述べられている。
[参考資料（相澤先生より）：
https://ymerleksi.wikispaces.com/file/view/Translation+Universals.pdf]
　各々の翻訳において起こることは異なっている。
　翻訳作業とは、ソース文書をターゲット文書に置き換える作業。その間には、文法構造(syntax, grammar)を考慮した置換がなされる。これを翻訳と呼ぶ。

テキストコーパス

　英語への翻訳は、コーパス研究(corpora study)に基づく。
→用語を再度組み替える（reformulate）

考えるプロセス(rendering procedure)で何が起こっているか

　ターゲット文書において起こること（単語の選択、その他）をモニタリングして、それをformulateする。

その理由

　ひとつの説明が必要。
　なぜそのようになるのか。なぜそれは可能なのか？
　ソース文書とターゲット文書の間には、言語と頭脳(mind)がある。
　ふたつの言語間のlexicon（辞書）
　単語を見聞きすることで、より様々な翻訳をすることが可能になる。

プライミング効果（Priming effects）

　人間の頭脳(mind)における無意識の活動
　1980年代に発展した方法
　例：Yellowとbananaという用語を関連用語として結びつける（redよりもbananaにふさわしいのはyellowと判断できる）
　逐語的ではない翻訳の生成(produce non-literal translation)を可能にする。
　追加の知覚努力(extra cognitive effort)を再現する。

CasMaCATを活用したデモ

　左の欄に原文、右の欄に機械翻訳の出力文が表示され、右の欄を修正することができるようになっている。
　注目に値するのは、多くの可能性が出てくることにより、翻訳者にとって選択の幅が広がるという点である。　出現頻度の表示もあり、このような豊富な選択肢をすべての翻訳者が利用可能である。
　ひとつの単語を選択、これを関連づける。
　近似値の測定（どれくらいの労力がはらわれたか）
　辞書は、簡単に利用可能。
　翻訳における多くの選択肢（perplexity）
→多くの選択肢があれば、それだけ、考える時間も長くなる。

カール先生の関連講演（From CasMaCat to SEECAT: Patterns of Interaction in Advanced Computer-Assisted Translation,
<http://www.slideshare.net/yandex/from-casmacat-to-seecat-patterns-of-interaction-in-advanced-computerassisted-translation>）のプレゼン資料より補足：
　一から翻訳すると機械翻訳結果を人手で後から修正する場合よりも時間がかかる（スライド10より）

機械翻訳＋ポストエディット

　例：ドイツ語への機械翻訳の結果
　１つのイディオムについても、翻訳のばらつきは大きい。
　よいドイツ語でないという程度では修正（ポストエディット）されないことも多い。

翻訳者の創造性(creativity)

　英語→ドイツ語、英語→スペイン語
　翻訳者にとって困難な現象としては、翻訳およびポストエディットにおけるバリエーションがより豊富であること。

翻訳者により異なる行動

　翻訳を開始するときの行動からして、数ワードを見て一気に翻訳をし始める人も、文章全体を最初にじっくりと読む人もいる。内容を理解するために訳す前に調べものをする人もいる。
　類似した言語同士の翻訳では、ほとんど用語から用語のコピーになることもある。

　最初に曖昧でないかどうかよく見よう。
　無意識をやめる。
　修正のしかたもひとにより、そして段階により異なる。
　修正は通常、数回にわたって行われ、最初の修正は通常、長めになる。（この時点で判断のプロセスが始まっていると言える）

　ポストエディットは内容に慣れるにつれてだんだん早くなっていく

ご講演後の質疑応答による補足

　翻訳プロセスの研究のため、キャリアの異なる様々なフリーランス翻訳者を集め、行動の相関性をみることを行っている（学生も参加）。

翻訳者との相関関係

　より経験のある翻訳者は、新しい文書を見たときに、どのように訳すべきかのイメージが湧く。そして、翻訳作業がはやく、見直し(revision)に多くの時間を費やす。
　講演後の質疑応答では、第二言語でのライティングの支援等に使えたらよいという意見も出た。

感想

　非常に興味深いご研究内容だと思ったものの、理解しきれない内容が多かった。
　相澤先生がご厚意で私の危なっかしいまとめのご校閲を引き受けてくださった。ご講演者のCarl先生の関連資料を教えていただいたので拝読してみたところ、そのご研究の幅広さと、非常に先を読み、具体的で面白い調査をなさっていることが感じられた。面白くて専門家でなくても分かるようなプレゼン資料が作られている。
　機械翻訳というと人間からかけ離れているように思いがちだが、Carl先生のご研究では、どのように翻訳をしているのかを学生を含めた様々な翻訳キャリアの人々に協力してもらい観察したり、機械翻訳を使用するとどのような違いが出てくるかを統計にしたりしている。その手法にも、目の動きを測るなど、大変斬新で面白いものが含まれている。
　多くの人（特に機械翻訳を支持している訳ではない人）にとっても、興味深い研究をされている素晴らしい研究者だと感じた。お話を伺うことができて大変光栄だっただけではなく、このような視点で研究に取り組んでいる方がいらっしゃるから、国内のみならず海外の研究者との交流に意義があるのだな、ということを実感させられた。影浦先生・相澤先生の国内外の研究者との素晴らしいネットワークを、どうかこれからも大切にしていただきたいと思う。

See below for English:

Prof. Carl’s presentation was quite interesting, but was sometimes too technical for me to understand. Luckily, Prof. Akiko Aizawa at NII kindly helped me prepare this report. She showed me some links to reference materials on the web (including presentation materials of Prof. Carl’s other presentations). Reading the reference materials was an exciting experience. I can now comprehend that Prof. Carl’s researches are conducted with a wide range of perspectives, and that he has a foresight. Furthermore, his presentations are based on specific and interesting studies with human translators. His presentation materials are so interesting and specific that people (like me) not experienced in translation study or machine translation can understand them.
Machine translation seems to be something distant from human being. Some human translators seem to hate or worry about it. Prof. Carl’s focus on human translator is quite different from such images. For instance, in Prof. Carl’s studies, experiments are made with cooperation by translators with different levels including students. They are conducted to find how translation processes are carried out, and how they change with use of MT, etc. The methods, for instance, include eye tracking. Wouldn’t it be interesting?
Prof. Carl’s research can attract a wide variety of people (including those who do not welcome machine translation). It was really a nice opportunity to listen to him.
Researches with unique perspectives, ideas, etc., are treasurous and helpful for us all. For this reason, communication with researchers not only in Japan but also from abroad seems to be indispensable. Researchers’ achievements and talents can be communicated to people through writing or speeches. I really appreciate Prof. Kageura and Prof. Aizawa for introducing Prof. Carl at the seminar. I hope the researchers’ network around the world (whether they are from Japan or from abroad) will be maintained and flourished towards the future (eternally, if I may say).