日本翻訳連盟(JTF)

AI の未来を見据えた翻訳の役割(前編)
――株式会社松尾研究所・山田悠生経営戦略本部企画室室長に聞く

AIの登場と近年の急速な普及は社会のあらゆる面に革新的な変化をもたらし、なおも留まることなく日進月歩の進化を続けています。その影響は言語・翻訳業界にも多大な変革を及ぼしつつあります。本特集では、東京大学の松尾・岩澤研究室の先端的な研究成果を社会実装し、AIソリューションの開発・提供、人材育成に取り組んでいる株式会社松尾研究所 経営戦略本部企画室室長の山田悠生氏にAIの現在と未来について伺い、AI時代に言語・翻訳業が果たすべき役割を、2回にわたって考えていきます。

Interviewer: JTFジャーナル編集長(JTF 専務理事)、株式会社インターブックス代表取締役 松元 洋一
●人間の知能でできることはAIでできる

松元:本日は、AIの最新の状況と、今後どうなっていくのかという未来の予測をお聞きしていきたいと思います。日本翻訳連盟は、翻訳者が約800名、翻訳会社が約200社、それから数社の企業も会員になっている業界団体です。今AI(人工知能)が非常に発達して、翻訳者の皆さんは大変脅威に思っています。

いろいろな分野のAIがありますが、特に大規模言語モデルや自然言語処理の部分についてお話しいただければと思います。はじめに、松尾研究所の組織についてお聞かせいただけますか。

山田:株式会社松尾研究所は、2020年に立ち上がった株式会社です。もともと東京大学の中に松尾豊の研究室(大学院工学系研究科 技術経営戦略学専攻 松尾・岩澤研究室)があって、そこに伴走する形で、大学の枠内ではやりにくいことをやっていこうというミッションで設立されました。

具体的に何をやっているかというと、大きく2つあります。1つは人材育成業務です。AIを使いこなせる人材を育てていくための取り組みです。もう1つは、企業との共同研究です。後者では、AIを自分たちの業務に組み込んで活用していきたいというニーズをお持ちの企業と、私どものデータサイエンティストなどが組んで、その企業のAI導入やアプリケーション開発などを進めていくといった試みを主軸に行っています。

松元:2020年に設立されて、松尾先生はよく「AIを人間の脳に近づける」というような発言をされますが、やはり究極は「人間の脳をつくる」というところなのでしょうか。

山田:そうですね。私たちは、東大松尾研と株式会社松尾研究所を合わせて「松尾研」と呼び習わしていますが、そのミッションとしては、「知能をつくる」ということを掲げています。

もともと今の主流のAIというのは、人間の脳の仕組みを模してつくられているんです。ニューラルネットワークというものがあります。これは基本的に人間の脳細胞と一緒で、ある情報を与えられた時に、何かしらの条件で発火して反応したものがまた計算されて、出力に落ちていく。脳と同じことをプログラミングでやっているだけといえばそれだけの話なのですが、人間の脳細胞のように大量の層をつくって複雑な情報を処理できるようになったのがディープラーニングです。その1つの特殊なタイプであるトランスフォーマー(Transformer)というのが2017年にGoogleから発表されまして、これが今、生成AIの基盤になっています。

基本的には人工知能というのは人間の脳の仕組みを模しているので、「人間の知能でできることはAIでできるはず」というのが基本的な考え方と言ってもいいと思います。ただ、それが人間を完全に超えるのにどのくらいかかるかは、今のところまだ見通せない状況です。

松元:2035年にシンギュラティ(AIが自己進化を繰り返して人間の知能を超える転換点)が起こると以前からいわれていますが、実際にはシンギュラティはかなり加速度的に近づいているのでしょうか、それとも遠のいているのでしょうか。

山田:いわゆるビッグテックと呼ばれるような米国や中国などのITの大きな会社や、日本だとソフトバンクの孫さんのような方の発言を見ていると、早まりつつあるという見通しの方が多い印象です。1~2年くらい前ですと「2030年に到達したらいいね」と言っていた方が、今は「2020年代の後半にはできるだろう」と言っていたりしますね。

松元:3年後ぐらいですか。

山田:もちろん自社の資金調達などに役立つからという、ポジショントークのところもあると思いますが、人間ができることは全部汎用的にできてしまうAGI(汎用人工知能)に関しては、2030年より前にできるんじゃないかという見通しの方が多い印象です。

●「松下幸之助AI」プロジェクト

松元:松尾研究所では企業連携をされているとのことですけれども、具体的にはどういう企業とどのような研究テーマで連携されてきたのか、教えていただけますか。

山田:今まで本当に幅広いプロジェクトを手掛けていまして、だいたい常時25~30件くらいのプロジェクトがパラレルに進行しています。そのうち何件かは、提携する企業様との合意のもと、プレスリリースの形で紹介しています。その1つに、パナソニックさんの「松下幸之助AI」というプロジェクトがあります。

松元:今、高市早苗首相のAIもあるらしいですけど、「松下幸之助AI」は何か発言するんですか。

山田:松下幸之助さんの本や、過去に話された映像やインタビューなどの動画を学習させて、松下さんだったら今の日本や世界の経営課題・人生や生活上の問いに対してどう答えるかをAIが生成します。例えば人間はどのように生きていくべきかなどと問い掛けをすると、松下さんのように答えてくれるというものです。ちょっと考えた後で、まずスクリプトがつくられて、音声でしゃべります。

松元:それはぜひ聞いてみたいですが、誰でも聞けるのですか。

山田:はい。パナソニックさんから公式に公開されています。

https://www.youtube.com/watch?v=-U0p3cPMn6M

松元:声もAIでつくった音声なんですね。本物みたいです。

山田:これを生前の松下さんをご存じの方に聞いていただくと、割と自然な発声だとおっしゃいます。大阪訛りもされています。

松元:そう考えると、例えばナポレオンなど世界の過去の偉人のような人も、貴重な資料などが残っていれば、それを元にその人の考えを聞けるというような時代がやってくるのでしょうか。

山田:そうですね。以前、確か美空ひばりさんでしたか、もう亡くなられた歌手の方の再現をするということがありました。美空さんの生前の声や表情などを学習させて、新しい曲を歌う様子を出力できるようになっているというものです。

松元:この前、NHKで見たのですが、松任谷由実さんが自分の今の歌声と若い頃の歌声をAIで融合させて、AIと人間のコラボでアルバムを制作するということをやっていました。

山田:そういう形で、「誰々のAI」みたいなものは今、けっこう増えてきていますね。東京都知事選挙の時に展開されていた「AIゆりこ」もそうですし。

松元:そうでしたね。前のニューヨーク市長もやっていましたね。本物が言っていると勘違いする人もいて、ちょっとびっくりします。

山田:こうした形で、AI社長とかAI役員なども最近増えてきています。実際の社長や役員の方を模すパターンもあると思いますし、AIに別の人格を与えて役員会に加わってもらうといったこともあります。

松元:そうなってくると、本当に人間が必要なくなってくるようで、恐ろしいですね。

●クリエイティブな業務にも進出

山田:松尾研の企業連携で言葉に関する別の事例では、2025年4月にリリースが出ましたが、博報堂さんと共同で開発した、広告表現をAIでつくるというプロジェクトがあります。今、広告代理店でも、いわゆるクリエイティブなものをつくる時に、AIに売れっ子のクリエイティブディレクターの考え方や過去につくったものなどを学習させて、その方っぽく発想して広告案を出すといったことが取り組みとしては行われています。そういった形で、クリエイティブなところにもある程度、AIが入ってこられるようになってきました。

松元:この前、テレビ東京のビジネス番組を見ていたら、もうマーケッターは不要になると言っていました。確かに今は、キャッチコピーでもなんでも、AIに聞くと山のようにアイデアが出てくるじゃないですか。人間ではこうはいかないので、そういうふうに一流のクリエイターの考え方さえ入れてしまえば、それこそ、それっぽいものが出ますよね。

山田:そうですね。特にデジタルの分野ですよね。デジタルマーケティングだと、広告主の依頼に応じてAIで広告をつくって、それを例えばYouTubeに広告として出す。出した結果、どれだけビュー数・コンバージョンレートなど、いわゆる数字で測れるものが上がったか下がったかがすぐわかるので、「じゃあAIに広告案を100個出させて、その中で使えそうな10個を選び、数字で効果を測ったうえで、効果の最も高かったもの1個を本格的に展開しよう」といったことがすごく容易にできるんですね。

当たり前ですが、AIとデジタル的なビジネスモデルはすごく相性が良くて、そこに対応しているとAIの恩恵は大きいかもしれません。

松元:アルファ碁や将棋などでもAIが話題になっていますが、率直に言ってどうなのでしょうか。チェスはディープ・ブルー(チェス専用のスーパーコンピュータ)が出て、完全に強くなっていますけど、アルファ碁ももうその域に入っていますし、将棋もかなりすごいですよね。

山田:チェスや囲碁などは、自分と相手の盤面に置かれている駒や取る手がすべてわかる「完全情報ゲーム」でパターンが決まっているので、膨大な選択肢を演算するAIに勝るわけがないんです。2016年に世界トップ棋士のイ・セドルさんが、アルファ碁と対局して敗れましたね。将棋もそれに次ぐ形でしょう。当初は電王戦などでけっこう、いい勝負をしていたんですけど、数年経ったらもう全然勝てなくなる感じになりましたし。

松元:そう考えると、もう人間のやる将棋とAIがやる将棋を分けないと難しくなってくるんでしょうか。

山田:ただ一方で、将棋がすごく盛り下がったかというと、全然そんなことはないと思っています。例えばタイトル戦でも、AIが評価した値が画面の下などに出るじゃないですか。あれをみんなで見て、生配信中の動画コメント欄などではそこに沿って人間が指すかどうかでけっこう盛り上がるらしいです。たまに藤井聡太さんなどが指した手が、AIが予測した最善手ではなかったけれど、その後の流れから考えると、実は最終的にそちらのほうが良かったということがあって、それで人間がAIを超えたといって盛り上がる。楽しみ方がちょっと変わってきた感じはありますね。

AIと人間が戦って、人間が勝てなくても別にいいのだと思います。ただ人間同士が戦う時に、AIをサポート役というか、ツールとして使うことによって、余計にタイトル戦が盛り上がるみたいな感じでしょうか。AIはどこまでいってもやはり道具だと私は思っているので、そういうのは道具のうまい使い方だと思いますし、そのほうが人間の心も豊かになるんじゃないかと思います。

松元:松尾研の連携事例としては、パナソニックさんとか博報堂さんの他にはどのようなものがありますか。

山田:その他にもいろいろなメーカー、サービス業、建設建築、メディアなどとの連携があり、様々な業種業界にわたっています。使うAIも、画像認識や先ほどのAI松下幸之助のような音声合成もありますし、データをたくさん使って良い示唆を出すような、より古典的なデータ分析系もあります。よりクリエイティブな分野で言えば生成系もあります。

ただ、生成AIを使えば、その会社のビジネスが必ずしも良くなるというわけではなくて、誰でも比較的簡単に学べる「機械学習」と呼ばれる古典的なAIでも、うまく使うとその会社の効率化が果たせることが少なくありません。松尾研でも、生成AIの時代だからといって、全部生成AIで何とかしようとは思っておらず、最適な技術を最適な形で活用することを目指してやっています。

●文脈を理解する「トランスフォーマー」

松元:しかし、最近は生成AI、生成AIという流れになっています。これまでも第1次AI革命、第2次AI革命と、人工知能をつくることを主眼にやってきたわけですが、初めはワッと盛り上がっても「やっぱり無理じゃないか」とすぐ盛り下がって、ブームが来ないで終わっていたように思いました。今まさにブームが来た感じがします。もうこれは止められないですよね。

機械翻訳の世界でも、2016年にGoogleがニューラル機械翻訳(NMT)を出して変わってきました。それまでは統計ベースやルールベースのぎこちない翻訳だったので、「人間の翻訳には絶対近づけない」というイメージでした。ところが、ニューラル翻訳は自然な流れの言語処理なので、訳が合っているか間違っているかは別として、画期的に人間に近づいたなという印象はありました。

自然言語処理の話なんですけど、今、機械翻訳とかディープラーニング技術を用いた大規模言語モデル(LLM)があって、今後、生成AIと一緒に進んでいくものなのでしょうか。それとも全く違う要素のものなのでしょうか。そのあたりの切り分けが難しくて、機械翻訳で出力するものもニューラル翻訳と言われるように滑らかにはなっているわけですけど、生成AIはもう一歩先を行っていて、要約して出すとか、いろいろな機能があるイメージです。そのあたりはどうなのでしょうか。

山田:私も学術的に必ずしも正確なことを申し上げられませんが、機械翻訳と言われるものの多くは、いわゆるコーパス(大量の言葉とその用例などを集めたデータベース)を学習させて、そこに沿って出力するということがベースになっています。

一方で、今のトランスフォーマーや生成AIを使っている場合は、コーパスだけに限らず、さまざまな言語データ、例えば本や論文など、SNSに氾濫している大量の投稿や、個人のブログなども含めてとにかく大量に学習させると、人間のように柔軟な言葉の使い方みたいなものをなんとなく覚えるんです。ですからそれを使うと、出力は非常に滑らかになります。

例えば、私が「カジュアルな感じで答えてくれ」と生成AIに言うとタメ口で答えてくるし、「あなたは私の部下で、1年目の社員です」という役割を与えて、「これこれこういうことについて調べて」と言うと、すごく丁寧な口調で返してくるという形のチューニングができています。
ただ、この2つが必ずしも全く独立した技術というわけではなくて、いわゆるニューラルネットワークとかディープラーニングと言われる技術のうちの特殊な形が、トランスフォーマーと呼ばれる構造です。

トランスフォーマーの大きなポイントは、アテンション(Attention、注意)機構といわれる仕組みを取り入れていることにあります。それは、処理する言葉をバラバラに分解して、分解した言葉の間の繋がりなどを把握できるようになっているんですね。例えばある小説の中で、山田太郎さんという登場人物がいたとして、「山田太郎さんがこういうことをした。彼はそれを振り返ってこう言った」という箇所があったとします。その「彼」と「山田太郎」という指示語と指示対象の関係がわかるというような形です。いわゆる文脈を理解する力が非常に伸びたんですね。

私も、いわゆる第3次AIブームの頃、ちょうどディープラーニングが盛り上がった頃にAIに関心を持ち始めて、展示会などでいろいろ聞いていたのですが、当時のディープラーニングでは、例えば「白雪姫の物語を要約してくれ」というタスクがうまくできなかったそうです。

白雪姫って、美しいお姫様がいて、継母に妬まれて殺されそうになるところを逃げて、7人の小人に出会って、毒リンゴを食べちゃって、王子様がやってきて、キスをしたら目が覚める。大雑把に言えばそんな話だと思いますが、ニューラルネットワークは基本的に、一番新しく出てくる言葉を重視してしまう。つまり、「王子様がやってきました、白雪姫が起きました、ハッピーエンド」という終盤の展開だけを取り上げてあらすじにしてしまうんです。その前の、継母との確執とか、7人の小人との愉快な生活とか、毒リンゴを食べてしまうとか、そういうものが全部出てこない。

そういう意味では私たちが理解しているような言葉の使い方、文脈の取り方や言葉全体が意味するニュアンスなどは必ずしも理解できなかった。それが、ニューラル翻訳のポイントだと思います。今は文脈などもけっこう理解できるようになっているので、例えばビジネス文書であれば硬い言葉で出力するべきだとか、子ども向けの小説だったら平易な表現をしてあげるとか、そういったトーンの付け方が非常に簡単にできるようになっているのが違いかと思います。

松元:そうしますと、クリエイティブな翻訳ではいいんだろうと思いますが、産業翻訳では、勝手に要素を付け足されたりすると困るわけです。直訳で正しく翻訳するという前提があるので、勝手に解釈して余計なものを付けたほうが良いということは基本的にありません。産業翻訳のような場合だと機械翻訳のほうが役に立つというか、向いているのでしょうか。

山田:まさにおっしゃる通りだと思います。生成AIが出てきた時に一番問題になったのが、ハルシネーション(幻覚)という現象です。ハルシネーションにもいろいろあって、間違った回答をする、聞かれていないことを答える、実際には存在しない架空の情報を返すなどといったことがあります。例えば、「日本の首都は?」と聞かれたときに「大阪です」と返してきたりする。トランスフォーマーをベースにした大規模言語モデルと呼ばれるものは、どうしてもそういう性質を持ってしまうんです。

必ず何かを出力しないといけないけれど、わからない時にわからないと言わずに、適当に、その時に統計的に一番もっともらしいことを出力してしまう。人間だったら「いや、日本の首都が大阪っておかしいな」と思って調べて、「首都は東京です」ということになるんですけど、単純な大規模言語モデルの場合はそれができない。だから、あたかも自然な、流暢な表現だけれども、間違ったことを言う。私たちも日本の首都のことなら間違っていると気づきますが、「コートジボワールの首都」だったら気がつかないかもしれない。それで、生成AIを使う人間が間違った結論を導いてしまうということがけっこう多かったですね。

今はこれも変わってきてはいます。例えば2025年8月にOpenAIから「GPT-5」という最新モデルが出ましたが、ハルシネーションの発生率はかなり減っているといわれています。わからないときに「わからない」と回答することもできるようになっています。実際に研究室の中で最新モデルを使っている人間と話をすると「確かに減っているね」という印象でした。

ただ一方で、また別の問題が出ていまして、勝手に言葉をつくってくるんです。カギ括弧(「 」)付きの、あたかも固有名詞みたいなものを勝手に出してくる。例えば私が「これこれこういうことを調べて」と言うと、カギ括弧付きで「こういうことがあります」みたいなことを言ってくる。私からすると、これはすでにある表現を引用してきているのか、それともChatGPTが勝手につくっているのかがわからないので、困るということもありました。

次ページ >

共有