日本語翻訳の重要性を言語権から考える(前編)
講演者:HALライティングカレッジ代表、英日・日英翻訳者 豊田憲子さん
●人間言語とAI
次にAIと言語権の関係についてお話しします。
AIには、もちろん素晴らしい面もあります。AIに限らず、物事は何にせよ、いい面と悪い面の両方がありますが、そこをトータルしてどうするかという結論に至るところが大切です。しかし今、少なくとも日本においてはAIの今後について大丈夫かなと感じています。
先ほどちょっと申し上げましたが、もともと言語権というのは、何人たりとも自分が使いたい言語を誰からも侵害されてはならない、また人の言葉を奪ってはならないという考えです。
現在、世界中で7168の言語があるらしいです。ところがそのうち3045の言語が絶滅の危機に瀕しており、保護が必要ではないかということで学会もつくられています。日本においても、アイヌ民族の言葉の保護運動が起こって、北海道大学などでもアイヌ語の学科が設置され、言葉だけではなく、アイヌ民族の文化、生活、思想なども含めて保護して後世に伝えていこうという動きが、現在できていると言われています。
しかし、ここ5~6年の翻訳まわりの状況を見ていますと、その言語権が、人間言語vs機械言語・AI言語という形になってきているのではないでしょうか。このままですと、人間言語のアイデンティティや思想が、正しい形で海外に伝わるのかという疑問を感じざるを得ません。
ですから、ここでもう一度、自分の国の言葉、危機に瀕している言葉も含めて世界のあらゆる言語を大事にし、さらに、人間言語が正しい形で存続し、駆逐されないようにするためにはどうすればよいかを考えていく必要があると思います。
●デジタル化進展による著作権規定の変化
これに関わることとして、著作権の現状も見ておきましょう。
最初に私は著作権の専門家ではありませんので、一生懸命勉強はしましたけれども、言い足りないところがあるかもしれないというところを、お断りをさせてください。
今、「AI開発学習段階」、それを取り込んだ後の「生成と利用段階」、「AI生成物(AI生成コンテンツ)を著作権として認めるか」という、3つの観点から様々なことが考えられています。著作物を学習用のデータとして、クローリングとかスクレイピングとか言われていますけれども収集複製をして、学習データを生成していく。そしてデータセットから学習済みモデルを開発していくという流れです。
平成30(2018)年に著作権法30条の4が改正されました。改正前は、「あなたの著作物を学習用のデータとして取り込ませていただけますか」とか「データセットしました」ということを、著作権者に1件1件お断りしなければなりませんでした。ところが改正後は、著作者の権利が少し制限されるようになりました。
これに関して、令和元(2019)年に、文化庁著作権課が「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」(※2)という資料を出しています。
その中に、柔軟な権利制限規定の整備によって生じる効果として、「人工知能(AI)開発のための深層学習、サイバーセキュリティ確保のためのソフトウェアの調査解析、所在検索サービス、情報解析サービス等、通常権利者に不利益を及ぼさないもの、又は権利者に及ぼし得る不利益が軽微なものに留まる形で著作物の利用行為が行われる様々なサービス等の実施について、権利者の許諾なく行うことが可能となり、イノベーションの創出などが促進されることが期待される」(同資料問3)と書かれています。
つまり、通常の不利益を及ぼさない程度のものであれば、その1件1件について今までお断りしなければいけなかったところを、端折ってもよいということを示しています。結局のところ、イノベーションの創出を優先しているわけです。
●AIは人間ではないから規定の枠外か
また、「著作権法の目的は、通常の著作物の利用市場である、人間が著作物の表現を『享受』することに対する対価回収の機会を確保することにあると考えられることから、法第30条の4における『享受』は人が主体となることを念頭に置いて規定しており、人工知能が学習するために著作物を読む等することは、法第30条の4の『著作物に表現された思想又は感情を享受』することには当たらないことを前提としている」(同資料問11)という文言もあります。
つまり、「享受」は人が主体となるけれども、機械翻訳やAIは人ではないから、この第30条の4の規定の枠外であって、著作物を学習データとして採用したりクローリングしたりするときにも、1件1件のお断りはもうなしにしましょう、というような形にしてしまった。著作権者の立場からいうと、権利が少し制限される形になってしまったわけです。
この権利制限規定というのは、もう少し言葉を足しますと「著作権者の許可なく利用ができる」ということをいっています。例えば、情報解析のためならば、著作物の録音、録画その他をしてもよいということで、これを根拠として、クローリング、収集した学習データをもとに、いろいろなAI開発やアプリなどが出てきています。
講演の時点で最新の令和5年(2023年)6月の文化庁著作権課セミナー「AIと著作権」には、著作権法第30条の4の「AI開発学習段階での著作物利用」(※3)について、以下の文言があります(p.36)。
非享受目的の行為については、これを著作権者の許諾なく行えることとしても、著作権者の経済的利益を通常害するものではないと考えられます。 ※そのため、法第30条の4では、「享受させることを目的としない」場合であれば、「非営利目的か否か」、「研究目的か否か」といった点を問わず、著作権者の許諾を不要としています。 |
ここで注目しておきたいのは、「非享受目的行為について著作権者の許可なく行ったとしても、その著作権者の経済的利益を通常は害さない」という把握から、著作物をAI開発段階に利用していることです。
非享受目的行為ならば非営利目的か否か、研究目的か否かを問わず、著作権者の許諾は不要、というのが原則なのですが、同資料にさらに注目すべき文言を見つけました(前出資料p.38)。
主たる目的は、情報解析の用に供する場合のような非享受目的であるものの、これに加えて享受する目的が併存しているような場合は、このような利用行為には本条は適用されません。 |
つまり、「非享受目的」と「享受目的」の併存が見られる場合は、著作権者の許諾が必要であるということです。この点が、規制が少し戻った感があるところです。
ただし、「経済的な利益を害されている」ケース、または「享受目的なのか非享受目的なのか」の判別が難しいケースでは、結局は司法の場に持ち込まなければなりません。
●著作権侵害に対して個人で戦えるのか
そうなると大企業ならいいけれども、個人が、自分の著作物が勝手に使われているのではないかというときに、どのくらいの経済的損失を被っているかとか、享受・非享受の判別はかなり大変になります。そもそも自分の著作物や訳文がどこにどう学習されたかについては、お断りがないから、エゴサーチというんでしょうか、自分で調べない限りはわかりません。まず、その調査をどうするのかという問題があります。
このような状況において、下記の文言が入ったのは、少しだけ良くなったところかなと思います(前出資料p.39)。
「著作権者の利益を不当に害することとなる場合※」は、本条の規定の対象とはなりません(法第30条の4ただし書)。 ※例えば、情報解析用に販売されているデータベースの著作物をAI学習目的で複製する場合など |
これによって、今までは、享受目的以外のものは全部OKだったのが、「ライセンス市場が成り立っている著作物を、権利制限規定により許諾なく情報解析用に利用できるとしてしまうと、著作権者の利益を不当に害するおそれ」があるということで、もう少し厳密に判断していきましょうという気配が見えるようにはなってきました。
そして今後は、著作権者の利益を不当に害するかどうかは、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、最終的には司法の場で個別具体的に判断されます」(前出資料p.40)というところまでは一応、来ました。
ただし、著作権周りの問題を司法の場に持ち持ち込むことを考えたときには、その実効性については疑問が残ると私は思っています。
まず、自分の著作物が絶対に盗られている、著作権が侵害されているということを、自分で見つけなければいけない。誰かが教えてくれるわけではないので、自分で調べなければなりません。
調べたらどうするかというと、申告制なんです。つまり、「私は著作権を○○さん、または△△会社に侵害されていました」と訴えなくてはいけない。文化庁などの公的機関が、著作権に違反している会社に、「あなたの会社は豊田さんの訳例を抜いて、こちらに無断転載しているじゃないですか」とかそんなことはやってくれない。自分で見つけて、自分で申告をしなくてはいけないのです。
みなさんは裁判の経験がありますか? 私は個人的に経験したことはないですが、周りを見ていると本当に大変です。道理的には絶対にこちらが有利なはずなのに、なぜこんなに面倒で長いのか、という感じです。
裁判を起こすにはまず、引き受けてくれる弁護士がいるかどうか。裁判費用もすごくかかります。そして一番大変なのが、すごく長い歳月がかかることです。相手がすんなり認めてくれればいいのですが、「いやいや、うちはそれを認めません」ということになると10年単位で時間がかかってしまう。大企業であれば資力も人材もあるからできるかもしれませんが、個人翻訳者がそこまでやるとなるとなかなか大変です。
先ほど言った、実効性としてはどうなのか、というのはこのあたりです。著作権者が、自分で著作権侵害を見つけられるのかとか、そこに費やすエネルギーとか、弁護士に頼まなければならないとなると、一応文言にはあるけれども、実際の効力はないのではないかと思うわけです。
それから、ここ4、5年ぐらいの業界の、特に機械翻訳関係のMTPEなどの仕事の単価が下がっているのはなぜなのかと思いませんか。知らない間に私たちの訳文がどこかで活用されていて、そういう形で私たちが貢献しているのに、その対価はなぜ下がるのかという素直な疑問も出てくるわけです。例えばその学習データの再利用や二次使用料に関する話はどこかでされているのか、このへんも大事になってくると思います。
●AIの利用規約で注意すべきこと
ここでAIの利用規約について、注意喚起ということでお話します。
みなさんは、ChatGPTやそれを利用したアプリなどのAIサービスの利用規約に、最初から最後まで目を通されていますか。意外と「利用規約ってなんですか」みたいな反応が多いのですが、これが落とし穴なのです。
まず、ChatGPTやその他でも、無料と有料で利用規約は全く違います。
基本的には、無料よりは有料のほうが、自分の権利も守られるし、訴えられる可能性も少なくはなるけれどもゼロではないんです。
私が一番怖いと思うのは、ChatGPTを含めクラウド系すべてにいえることですが、規約が後で変わることがあるということです。先日、LINEを利用していたら、どこかと合併したということで、新しい規約について「同意しますか、しませんか」と求められたことがありました。このように後でたびたび変わるんですね。となると、現段階の利用規約にOKしたけれども、将来それがどうなるのかわからない。いつの間にか変わっているということもなくはないので、そのへんも気をつけたいところです。
それから、先ほど「AI開発学習段階」「生成と利用段階」「AI生成物(AI生成コンテンツ)を著作権として認めるか」という3つの観点のお話をしましたが、学習サイドと生成サイドで、注意点が違います。それぞれで注意点が違うということも、意識して気をつける必要があります。
そしてもちろん、意識して誰かの作品や執筆内容をコピーしようとするのはNGです。
ただ、この「意識」「無意識」の境界線が曖昧です。無意識でたまたま出てきたものを使ってしまって、誰かの訳文と偶然に一致していたら、下手をすれば訴えられる可能性もあるわけです。これについては最後に、自分を守る対策というところでお話をしましょう。(後編につづく)
(2023年10月27日 第32回JTF翻訳祭2023講演より抄録編集)
注:本講演では、「令和5(2023)年10月初旬」までの文化庁や政府の見解を前提条件としてお話ししています。
※2 https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf
※3 https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf
◎講演者プロフィール
豊田憲子(とよだ・のりこ)
大学卒業後、外資系企業勤務を経てフリーランス翻訳者35年。主に学術論文や企業レポートの翻訳、原稿草案作成などに携わる。後進指導として翻訳学校指導歴25年、クリティカルライティング研究会15年でプロ翻訳者を約50名育成。2023年1月からHALライティングカレッジと名称を変えて翻訳サービスおよび翻訳ライティング人材指導を本格的に始動。
1 2