ABEJA Tech Blog

中の人の興味のある情報を発信していきます

AI生成物と著作権とAI倫理

本記事はABEJAアドベントカレンダー2022の17日目の記事です!昨日に引き続き担当の古川です!

昨日の予告通り生成AIによるAI生成物の著作権と倫理の話です。

生成AIと言っても主に念頭に置いているのは画像生成AIです(議論の発端自体はmimicやMidjourneyです。)。ただ、他のコンテンツを生成するAIにも基本的には同じ理論が当てはまるかと思います。

 

サマリ

やや法律的な専門的な話も含まれるので、結論だけ知りたい人のために、サマリだけ先に。

今主流の乱数やPromptから画像などを作ってくれる生成AIによるAI生成物には著作権が原則として発生しないです。

Promptの呪文の著作権が議論されることがありますが、議論の実益があるのかは疑問です。保護したいものが著作権のスコープではないです。

法的な観点とは別に倫理的な観点からいうと、色々考えてみる必要があります。

 

著作権の話

まず、話を著作権と倫理に分ける必要があります。これを分けずに議論していることを見かけるのですが、宜しくないです。

 

論点整理

著作権の問題と言っても色々ありまして、一番大きな問題は生成物に著作権が生じるかという問題です。AIで生成した画像に著作権が生じるかということですね。次の問題は、生成されが画像が偶然学習用画像とほぼ同一だった場合に著作権侵害が発生するかということが議論されています。また、画像生成のためのPrompt、呪文というやつですね、に著作権が発生するかも議論されています。ただ、後者2つ(偶然一致画像と呪文)は議論の実益がないというのが個人的な考えです。あと、実はAIで生成したコンテンツを人間が生成したと偽ることへの対処という問題もあるのですが、本日は扱いません。

生成物の著作権

まず、生成物の著作権を考えましょうか。この問題は政府の方でも過去から検討があります。

と、まあこんな感じです。まあ、言っていることは大体同じようなものでポイントは「人間の創作的寄与」があるかで、言い換えると「AIを道具として利用した」にすぎない場合は創作的寄与があって著作権が認められるが、簡単な指示にとどまるような創作的寄与がないAI創作物については著作権が認められないというものです(なお、よくAI生成物の著作権をどう処理するか法律上不明で法律の不備だというような意見を見るのですが、法律上はここで述べた通り判断基準自体は存在しています。基準のあてはめに難しいところがあるというのはAI生成物に限った話ではないです)。

つまりは、創作的寄与の有無がポイントなわけです。じゃあ、「創作的寄与とは何か?」ということが次に問題なわけですが、最新の2017年報告書ではAIの技術変化が激しく、具体例が少ないので、現時点で具体的な方向性を決めることは難しいと言っています。一応、同報告書は、学習済みモデルに画像を選択して入力する行為(これが何を指しているのか不明なのですが、恐らく画風等を変換するAIを指しているのかなと思います。)や大量の生成物から選択する行為が創作的寄与の根拠になるかもしれないことは述べています。

ただ、この手の報告書を読む際に注意しないといけないのは、書かれた時期です。最新の報告書が2017年です。この時期は、2014年にオリジナルのGANが発表されて、色々なGANの発展型やVAEの発展型が出てきた時期です。つまり、今われわれが目にしているような生成AIの基礎が形成されつつある時期で、報告書の考えている生成AIにGAN的なものが含まれていたのか、含まれていてもメインの想定だったのかやや疑問なところがあります。2017年報告書でAI生成物の例として挙げられているのがレンブラント・プロジェクトの絵画なのです。ただ、このレンブラントのはどういうAIを使ったのか良く分からない事例で、最終的に男性の肖像画を作成しているのですが、それはレンブラントの絵の統計を取ると男性が多かったから、人間がそう決めたというもので、また、目や口といった個々のパーツの構図のパターンをAIで分析して決定した後、AIでレンブラントの絵画の顔全体の構図(目と目の距離など)を測定して、目などの位置を決めていったというもので、かなり人間の手が入っている事例です。2017年報告書の「結構創作的寄与が認められるAI生成物もあるかもね!」というニュアンスは、今日では当てはまらない可能性があるかと思います。

現在的な画像生成AIを考えると、乱数から画像を生成したり、Promptでテキストを入力することで画像を生成できるもので、創作的寄与は否定され、著作権は発生しないかと思います。

なお、2017年報告書が示唆していたAIが生成した多数の画像の候補から選ぶ行為を創作的寄与と出来ないかですが、個人的には厳しいと思います。雑誌の表紙のコンペを行い、多数の画像から表紙に使うものを選んだとしましょう。このデザインの著作権者は?もちろん、デザイナーで、選んだ人ではないです。共同著作にもなりません。つまり、選ぶだけでは創作性のある著作行為とは認められないというわけです。ただ、デザイナーによる「強い」創作があるから、「弱い」行為である選ぶ行為が創作とはならないだけで、AIのように創作がない場合は、選ぶ行為を創作としても良いのではということも考えられますが、このような考えも難しいと思います。石を人間が芸術的な形に彫刻すればこれは当然、彫刻として著作権が成立します。では、たまたま同じ芸術的な形の形の石を河原で選んで拾った場合は?この場合も選んだので著作権が発生するのですかね?しないというのが一般的な考えかと思います。つまり、選ぶだけではダメなわけです。

Promptで指示を出しているのでこれを創作的寄与と言えるかですが、これも難しいでしょう。さっきの雑誌の表紙のコンペで、表紙のイメージを指示してコンペを行った場合であっても、先ほどと同様、著作権者はデザイナーです。

 

なぜ著作権を認めたいのか

どうも一部の間にはAI生成物にも一定の権利を認めたいというのがあるように感じます。それは、技術革新やイノベーションを促進したいという思いなのかと思います。ただ、現在は、イギリスなど例外的な国を除き、アメリカを含め多くの国ではAI生成物に著作権などの権利を認めていません。なのに、これほど生成AIがアメリカを中心に開発されているのですから、果たしてインセンティブを与えて生成AIを開発のイノベーションを促進というのがどこまで妥当するのか疑問なところがあります。

そもそも、AI生成物に著作権認める必要ないのでは?と私なんかは思うわけです。

生成物による著作権侵害

次にAI生成物が既に存在している著作物の著作権侵害を行う場合について考えてみましょう。

人間が絵をかいたら、既に存在する絵と類似する絵を偶然書いてしまったとしましょう。これが著作権侵害になるかというと、既に存在する絵のことを思い出して創作をしたわけではなくて偶然一致しただけなので、違反にならないというわけです。これを依拠性と言います。

で、AIの場合に依拠性が認められるのかですね。特に学習用データと類似したコンテンツを出力した場合に依拠性が認められるのかが議論されています。ただ、学習が上手く行かず学習用データと似たようなコンテンツを生成するような場合は別として、大規模なデータセットで学習した場合に、学習用データと類似するコンテンツが作成される確率は、かなり小さいのではないかと思います。なので議論する実益はほぼないように思っています。(また、最近の生成AIはFoundation modelを使っていることが多く、学習用データの数が膨大で、特にFoundation modelの学習段階を第三者が行っている場合、学習用データに含まれているか立証することが難しくなるかもしれません。)

とはいっても、一応議論だけしておくと、学習用データそのものがパラメータになっているわけではなく、学習用データやその類似物をそのまま出力するわけではないので、つまりは学習結果から学習用データの表現の本質的な部分が消えているので、依拠性は認められないと思っています。こう考えると、著作権侵害をした人が、嘘をついて「AIで作った」と抗弁することを心配する人もいますが、学習用データと類似するデータを生成する確率が低い以上、抗弁する側である程度主張を立証する必要があると思いますので、問題はなかろうと思います。

つまりは、AIを使って画像なりを生成する側が適切に記録を取っておくべきだと思っています。

なお、学習が上手く行っていない場合や変な学習をさせた場合(特定の作者の特定のキャラクターの画像のみ学習させた)は逆に依拠性が認められると思います。

あと、そもそも、創作的寄与があるから著作権で保護されるわけなので、依拠性も創作的寄与の部分について検討するべきじゃないかと思います。つまり、先に述べた選ぶ行為を創作的寄与として認めるのなら、選ぶ人が既に存在するコンテンツに依拠して選んだかという形で考えるべきではないかと思います。

呪文の著作権

現在の画像生成AIの中にはテキストによるPrompt、呪文と呼ばれるものをもとに画像を生成するものがあります。この呪文に著作権が成立するかをよく聞かれます。

ただ、議論の実益がないと思っています。年賀状用に「門松や羽子板に囲まれた新年を祝う白いうさぎ」という呪文で画像を生成したとしましょう。「門松や羽子板に囲まれた新年を祝う白いうさぎ」という指示、呪文が著作権で保護されるかということです。著作権で保護されるということは、「同じ(又は類似する)表現を使ってはならない」ということです。つまり、全く同じ「門松や羽子板に囲まれた新年を祝う白いうさぎ」という呪文を第三者が使ってはならないということになります。「白うさぎが正月飾りに囲まれてお祝いしている」という呪文は、内容は同一ですが、表現としては異なりますので、第三者が利用可能です。これが著作権です。著作権が保護するのは表現であり、内容ではないのです。このような保護が欲しいのでしょうか?なお、生成された画像自体は先に述べた通り著作権で保護されませんので、画像をコピーするのは適法です。呪文を著作権で保護することに何の意味があるのですかね?

そうではないはずで、欲しい画像を得るためには呪文を工夫しなくてはならず、そのノウハウやスキルを守りたいわけです。著作権は個別の表現を守るにすぎずノウハウを守るものではありません。著作権による保護ではなくて、不正競争防止法なりで保護するべき話になります。

または、「門松や羽子板に囲まれた新年を祝う白いうさぎ」という表現で指し示す内容(まあ、今回の場合は陳腐な内容ですが)を守りたいのかもしれませんが、著作権が守るのは表現で内容ではないため、著作権を認めても、先ほど述べた通り「白うさぎが正月飾りに囲まれてお祝いしている」というように異なる表現で同じ内容の呪文を利用することが可能です。

つまり著作権を認めても保護したいものが保護されるわけではないので、呪文が著作権で保護されるかという議論は、実益があまりない議論かと思っています。

 

AI倫理の話

以上が著作権の話で、次は倫理の話をしましょうか。倫理の話題は広範なので、ここでは昨日の記事で触れたmimicの事例で話題になった2つの点を述べたいと思います。1つ目は、画風をパクることの不当性、2つ目は、画家やイラストレーターの仕事の喪失の問題です。

画風をパクる

画風をパクるというのも色々あるのかなと思っています。元の画像と本質的には同じというものと線や筆遣いが同じ(画風・作風が同じ)というのは、著作権法上は別なのですよね。前者の本質的に同じであれば、類似性があって依拠性等もあれば著作権侵害につながっていくのですが、後者は類似性がなくて著作権侵害にならないとされています。まあ、本質的に同じというのをどう判断するかは難しいのですが。

このような作風のパクリはOKという著作権法の態度が本当に良いのかという問題はあります。なぜ作風のパクリはOKなのかというと、先ほども述べた通り著作権は具体的な表現を保護するものなので、作風は保護対象ではないと。背後には、色々作風をまねて研鑽することで新しい自己の作風を築いてゆくという点もあるのかと思います。なので、AIの場合は、単なるマネで終わってしまい、マネることによる新しい表現のようなものが生まれないという点があるのかもしれません。

仕事の喪失

mimicの件で特徴的だと思ったのは、イラストレーターの仕事の喪失を主張する声が結構あったように感じたことです。AIによる仕事の喪失というのは色々な場面で問題になるのですが、仕事の喪失の点がここまで強く主張されたのは、結構珍しいように思います。飲食店では自動で食べ物を運んでくれるロボット(これがAIかは別として)の導入が一部で進んでいますが、これに対してはウェイター・ウェイトレスの仕事の喪失の点から問題だという声はあまり聞かれないように感じています。また、昨日の記事でも少し紹介したように、意外と自動化が進んでも仕事が減っていない可能性もあり、そもそも本当に仕事が減るのかを考えてみる必要もあるかもしれません。

また、そもそもAIにどこまでできるのかという点をよく検討してみることも必要です。実際の性能的には人間の仕事を大きく奪うような「高性能」AIではないということが多いかと思います。意外とAIの利用場面が限られていることもありますので、利用する側や評価する側がこの辺をよく確認しておくことは重要ですし、サービス提供企業の方もこの辺りの情報をよく伝えておくべきでしょう。

また、仕事の喪失にばかり目を向けるのではなくAIを利用してどう新しい仕事や価値を作ってゆくかということの検討が重要かと思います。まあ、先ほど述べた性能と利用場面という話と同じではあるのですが(昨日の記事でも同じことを書きましたし)。

 

以上、画像生成AIに関して色々法的な点や倫理的な点について述べてみました。

あと、画像生成AIについていろいろ述べたので個人的な感想を言うと、あのようなAIのリリースは良いことだと思っています。もちろん、色々な問題ある利用への対応は必要ですが、ああいう新しい技術で新しい価値が生まれてくれれば良いと思っています。