遠隔同時通訳の幕開け ~RSI はあなたを幸せにできるのか?~
2020年度第1回JTF翻訳セミナー報告
遠隔同時通訳の幕開け ~RSI はあなたを幸せにできるのか?~
慎 征範 Shin Yukinori
大学卒業後、アイリスオーヤマ株式会社、株式会社第一勧銀情報システムにて開発や営業に携わる。主に3DCAD/CAM/CAE やラピッドプロトタイピングマシーンを生かした高効率な商品開発や、儲かる物作りの研究に取り組み、大きな成果をあげる。退職後、中国、米国、韓国にて10年以上にわたり現地在住日本人コミュニティに従事。韓国では在韓日本人最大コミュニティとなる「トモダちんぐ」を創設し、ブンダン日本語補習校を開校。2016年に帰国し、株式会社ABELON を設立。現在に至る。特許実用新案10 数件取得。グッドデザイン賞受賞。大阪芸術大学工業デザイン 学士。大連外国語学院 修了。
Torch Trinity Graduate University M.Div.
2020年度第1回JTF翻訳セミナー報告
日時●2020年7月30日(水)14:00~16:00
開催場所●zoomウェビナー
テーマ●遠隔同時通訳の幕開け ~RSI はあなたを幸せにできるのか?~
登壇者●慎 征範 Shin Yukinori 株式会社ABELON 代表取締役社長
報告者●伊藤 祥(翻訳者/ライター)
「遠隔医療、遠隔授業、遠隔会議、遠隔セールス、遠隔PCサポートなど、現在さまざまなサービスが遠隔に置き換わりつつある…」、と本セミナーが案内された頃にはだれもが遠い道のりの入り口に立っている気持ちだったかもしれないが、わずか半年ほどの間に事態は激変、生活の置き換えうる限りのものがリモートとなり、遠隔同時通訳も一気に目前の存在になった。
本セミナーでは、クラウド型遠隔同時通訳サービス提供のさきがけである株式会社ABELONの慎征範氏が、遠隔同時通訳(RSI)の開発の経緯、解決すべき課題、そして到達すべきゴールと、後に来るAI時代との繋がりについて、多くの経験談を交え語った。
講演時には最先端の遠隔同時通訳システムのデモが行われ、参加者は自身のスマートフォンとイヤフォンを用いてデモを体験した。
通訳翻訳とは無縁の工業デザイナーからRSIの世界へ
私の社会人としてのスタートは生活用品メーカーでの工業デザイナーから始まった。デザインした製品にはホースリールなどがあり、20年以上のヒットになったものもある。
その後、新境地を求めアメリカに留学した。当時からアメリカの教会には同時通訳が入っていて、エバンジェリスト(伝道者)との交流に同時通訳を使うことが多かった。国際化に伴い、言語は英・中・韓などがあり、安いシステムを使っているため、FMラジオと同じ周波数となってしまい、現地のスペイン語放送局と混信したり、ノイズが入ったりということが多かったが、本格的なものは単価も高いので、導入が難しかった。
iPhoneの3Gが出現したとき、これは教会の同時通訳に使えると感じた。ローカルエリアネットワーク(LAN)内に限定して配信すれば、遅延も少なくできるのではと考えた。
あるとき、教会のセミナーで、参加者の日本人の子連れのお母さんの困っている様子を見た。子どもが泣くとナースリールームに連れて行くのだが、そこまで赤外線の同時通訳が届かない。子どもが泣く度に何度も往復している様子をみて、同時通訳システム作りを決心した。
これが、第一号商品ABELON、今のinterpreteXを開発するきっかけとなった。ローカルエリア内に設置したPCをサーバーとして、通訳音声を配信した。このシステムはHPで無料公開配布したので、口コミでいろんなところで使われるようになった。Wi-Fiで音声が受信でき、機材はPCで済み、音も良く、専用の機材が不要だとよろこばれた。
会社設立後からの波瀾万丈のチャレンジ、「でも、どうしたら解決できるだろう」
ABELONは2015年に発売して間もなく、幸運にもアメリカの団体より武道館での同時通訳に使いたいというオファーがあり、それが大成功をおさめたことで、海外でも使われるようになった。
私は帰国後、商品名と同名の会社を設立し、ABELONを16言語同時に配信できるように性能を上げて発売した。2016年のメディアの総合見本市Inter BEEに出展し、たくさんの人からオファーをいただいた上に、とある同通業者からシステムを買い取りたいという相談を受けた。しかし、私のビジョンは世界で使われることだったため、お断りしたが、なんと、その同通業者はエンジニアを引き抜いた。さらにエンジニアはABELONの継続販売に対して300万円を要求してきた。実は、会社は私が立ち上げたが、コードの著作権はエンジニアにあり、顧問弁護士がソフトに強くなかったため、「エンジニアがコードの著作権を会社に譲渡する」という契約になっていなかったのだ。それで、やむなく300万円回収のためにがんばることになった。
そんな頃、シンガポールの某団体から、1万人の会場のイベントで使用したいとのオファーをいただいた。リハーサルは全く問題がなかったにもかかわらず、本番で通訳音声が途切れたり、スマホが接続できなかったりする事象が発生した。調べてみるとWi-Fiに空いているチャンネルが皆無だった。リハーサル時は参加者が入っていなかったため、どのチャンネルも使われていなかったのだ。8,000人を前にして、クライアントの担当者が真っ青になって対応に追われていた様子が印象に残っている。本当に苦労で白髪が増える思いだった。
RSIの開発とは、新しいシステムのだれもやったことがないことを想定し、仮説を立て、実証し、そして本番でコケるという大変ストレスの大きい仕事の連続だった。しかし、「…もうやめようか」という気持ちになった後、私はいつも「でもどうしたら解決できるだろう。」と考えるのだ。
シンガポールの一件の問題の解決については、クラウドならWi-Fiの構築が不要であるし、携帯を使えば安定通信が可能であることに気づいた。また都合のいいことに、携帯の周波数はキャリアに割り当てられている。基地局から電波が一台一台振り分けられていて混信がないのだ。Wi-Fiのコストも、回線が5Gになれば定額使い放題になるだろうと想定していたが、現在すでに実現している。ハッキングも容易にはできなく、同時通訳のセキュリティー問題もクリアすることができた。
そして、次なる製品interpreteXが出来あがった。interpreteXは2020年5月に正式発売されたが、実は昨年からベータ版を発表しており、2019年の建築学会などいくつかの大ホールでの国際シンポジウム、カンボジア・プノンペンでの8,000人級のイベントでも使用された。スマート社会に関する展示会CEATEC2020では、4会場遠隔同時通訳、最大350人規模で、公式アプリにinterpreteXのリンクが組み込まれた。音がいい、アプリがいらない、専用デバイスがいらない、スマホ・タブレット・PC対応可能でローコストであると、お客様に喜ばれた。
ところが、またまた失敗は成功の母、CEATEC2020では突然サーバーがダウンした。あろうことか、メインゲストのパネルディスカッションの15分前だった。原因は単純で、去年の3月からのログでサーバーのディスク容量がいっぱいになっていたのだ!50分で復旧したが、パネルディスカッションは後半にさしかかっており、パナガイドで対応していただき、売り上げは吹っ飛んでしまった。
2019年のアドテック東京では通訳者がマイクのミュートを切り忘れて聞こえないという事件があった。通訳者が習慣でボタンを押したらミュートとなっていたのだ。このとき、我々のエンジニアはついていたが、我々のエンジニアは通常の同通業者とは異なり、音声のモニターではなくサーバーのモニターを主としていたため発見が遅れた。現在は音声モニターも行っている。
プノンペンでは、参加者が多すぎて携帯回線がダウンしてしまった。原因は、日本では問題ない人数であるが、現地の携帯の基地局が中国の基地局の機材であったため、容量が小さかったのではないかと想定される。即、旧型のABELONに切り替えて事なきを得た。
RSIはみんなから嫌われる?みんなに求められる?
同時通訳システムの業界には、機材業者・エージェント・通訳者が参画する三位一体の強固な体制がある。RSIは入り込んでくる招かれざる客という感がなくもない。一方、価格が安くて使いやすいのでクライアントは使いたいという要望があるが、なかなか供給側からはよしとされない。通訳者はPCに慣れない、機材業者はリプレイスを迫られる、商流も変わる…。
一方、コロナでも、予定の売り上げが約1,000万円減となった。
「…もうやめようか」「でも、どうしたら解決できるだろう」
とにかく、地道に悪いところを直そうとバグの解決に務め、検証で使い倒した。
また、通訳者の言語ボタンの選択間違いや、マイクのミュートの切り忘れといったミスを解決するため、従来の同時通訳システムのコンソールデザインに囚われず、シンプルで一目見てわかるUIデザインとし、操作も簡素化した。
オンライン会議とつなげられないか、生まれた新しいニーズと新しいサービス
コロナの時代となり、オンライン会議の通訳では、なんと通訳者が3台ものPCを用意して、メイン会議をモニターしながらそれぞれのPCから英語や日本語の通訳を送っているという。 interpreteXなら、スマホがクラウドにつながったパナガイドのように使える。必要なのはPCとスマホだけだ。この使用法を提案してみたところ好評を得た。早速東京駅近郊にオフィスを借り、遠隔同時通訳センターを作った。interpreteXの操作に自信がない、自宅にPCや光回線がない通訳者は、センターに来るだけですぐに通訳ができるよう必要な機材を設置し、エンジニアによるサポートも提供する。通訳者の方にはできる限り安心して使って頂けるようにした。
そしてJAXA、東大とコラボのウェビナーでは、遠隔センターから2人の通訳者が通訳を行い、参加者は自宅でスマホで通訳を聴取した。NYの教育学者のウェビナーでは100人を超える人が参加し、4人の通訳者が自宅から遠隔で通訳も行った。証券関係や医療関係やメーカーなど利用者は多岐にわたり、実績は日増しに増えている。
interpreteXの利用料はオープンで安価、電話と同じ従量課金でクレジットカード払いとなっている。30人で2時間程度の社内会議だと5,000円程度。NTTの電話代よりも安い。ただし、サポートセンターの利用は別途お見積もりさせていただいている。今年には損益分岐点をこえるかどうかというところだ。
RSI、interpreteXのデモンストレーション
interpreteXの仕組みは、イベント主催者がイベントを作成するとコードが自動で生成される。そのコードを使って通訳者はGoogle Chromeから配信用のコンソールに入る事ができる。また参加者用にもURLやQRコードが自動で生成される。参加者はURLのリンクやQRコードからアクセスするだけでブラウザが立ち上がり、通訳を聞く事ができる。ソフトやアプリを入れる必要がないので利便性はとても良い。
エージェントは言語チームを必要に応じ設定しておく。リレー通訳も対応可能だ。通訳者のハンドオーバーはスムーズで、コンソールに入室できる通訳者の数は無制限。ある学会では最高16人の通訳者が入室した事がある。
費用は、お金も実際の利用時間ベースの従量額がリアルタイムで表示される。通訳者がコンソールボタンを押したとき、視聴者がアクセスしたときに、その時間に応じ課金される。
言語選択は即時に切り替え可能。タイマーに表示される時間は通訳者どうし共有されているので正確に交代もできる。GoogleのSpeech to textにも対応していて、聴覚障害の方向けやコピペで議事録を作ったりするような用途を想定している。現時点では実用に耐えうる精度ではなく試しで使ってほしい。
説明に続いて、実際に参加者がinterpreteXにPC、スマホ、タブレットなどの各々のデバイスで接続し、interpreteXへのログインから、実際の通訳者の立場での使用までのデモを体感した。これに対して、参加者からは、通訳者の交代方法、スマホの電池の持ちにいたるまで、実用に即した質問が寄せられ、音声がきれいであるとの感想ものべられた。
これからの通訳者へのメッセージ
RSIの障害として、インターネットが不安定な場合、切断し、音声配信が不可能になるので、ライブ配信と同じく通訳者も有線LANなどネット環境の整備が必要である。光回線で専用回線を引いておくことが望ましく、速度のチェックはしておくこと。また、PCに関しても、初心者こそ高スペックが必要と考える。メモリやCPUにどれぐらい負荷がかかるかわからないためである。Core i5/SSD/16GBぐらいのスペックはほしい。今後場所を選ばない、RSIは広まる。コスパのよいPCを買うべき。27インチぐらいのモニターが大きくて、デュアルモニターであれば便利だ。
マイクは3,000円ぐらいのものでも、レベルを調整すれば高いものと遜色ない。さらに、コントロールパネルで自分の声が割れないように適切なレベルにし、自分の口とマイクの距離を一定に保つ。だいたい15-20センチ程が適切。資料のめくり音には気をつけるか、タブレットで資料を見るようにするなど、雑音には注意する。通訳のレベルは高いのに他の点でお客様にストレスをかけるということがないように機材を使いこなしていただきたい。
加えて、ITスキルは必要になってくる。interpreteXを使いたい、通訳者も手配してほしいというご要望をいただくが、求められるのは、ITリテラシーが高く、トラブルに即対応できる人、それは自分でサポートできる能力か、平たく言えば自分でググれる人。自分で調べて検証して解決できる、他者もサポートできるような人が頼られる。インタープリター3.0は、通訳・ビジネス・ITスキルだと思う。通訳者は総じて優秀な方が多い。どんどん講習などを受けて、力をつけていただきたい。
RSIはあなたを幸せに出来るのか?
「こんなに安くすれば他の業者が困るじゃないか」という声もいただく。価格は企業のビジョンを表すファクターだと考えている。私達は、interpreteXでゲームチェンジを考えているのではない、RSIで同時通訳業界の裾野を広げたいと考えているのだ。従来は同時通訳は高価なので、利用されるお客様が限られていた。1回で50~100万、海外でやるならさらに高額になる。海外展開したいクライアントが、同時通訳に大変お金がかかるため躊躇してしまう、このような辛酸をなめる人を減らしたいのだ。エージェント、通訳者も、コロナ禍で多くの仕事を失っているが、interpreteXで仕事のニーズをつくりだすことができたと自負している。
我々の究極のゴールは自動通訳の実現である。AIによる通訳は機械的で人間味がなく、結局のところ人には敵わないと考える人は少なくない。しかし私はAI通訳こそ聞き手の心に届く声質や抑揚、そして話すスピードやコンテンツにあった適切なタームを出力し、プレゼンの目的を正確に把握し、達成できるように導けるようになると考えている。今はもちろん人間にかなわないが、いつかシンギュラリティが来ると確信している。
しかし、言葉は人間が使うもので、あくまで人間が主体である。例えば「あざまるすいさん」が「ありがとうございます」の意味だなんて、新しい言葉が普通に使われる言葉になるまで時間がかかるし、代替機の代替は「だいたい」であったが「だいがえ」という読み方も普及してきた。言葉は使う人間で変化するのだ。その点はAIはできない。そこから学ばないといけない。
Google仕事術の本によれば、「変化は突然やってくる。変化を受け入れ乗りこなし楽しむ。変わる前提で動いている人は柔軟に対応できる」そうだ。RSIはあなたを幸せに出来るのか?という副題だが、幸せとは言い換えれば心が満ち足りているという事であり、あなたは通訳のお仕事で心が満ち足りているか?あなたは通訳をするために生まれてきたのか?と問いかけて、Yesであれば、RSIという変化を受け入れ乗りこなして楽しむ事ができるはず。そうすればITリテラシーだって身につけることができるのではないかと思う。
ぜひ、今後も通訳者・エージェント・機材業者の商売が益々拡大することを祈念して終わりたい。