AI・機械学習と著作権
00
はじめに

AI作成や機械学習を行なっていて、著作権周りがややこしすぎると感じたため、自分なりにまとめてみようと思いました。色々な人の参考になれば幸いですが、読み進める前に以下の注意事項を必ず読んでください。

  • 筆者は法律の専門家ではありません。
  • 本記事の正確さを保証しません。内容が間違っている可能性があります。
  • 本記事は分かりやすさのため、正しい定義で言葉を使用していない可能性があります。
  • 法律は日々変わるものであるため、記事の公開日・更新日にご注意ください。
  • 本記事を参考にして生じた損害等の一切の責任を負いません。
著作権・著作物・著作者とは

著作権:作品を創作した人が、創作された作品の使われ方を決められる権利のこと。

著作物:著作権の対象になる作品のこと。例えば「絵・音楽・ソースコード」など。

著作者:著作物を作った人のこと。

要するに、「絵(著作物)」などの作品は、「書いた人(著作者)」の許可なく、誰かが勝手にポスターなどに使用すると、「著作権」を侵害することになります。

ライセンス・利用規約とは

「ライセンス・利用規約」とは、「著作者」と「著作物を使用する人」との間に交わされる契約のことです。契約者は「ライセンス・利用規約」の範囲内で著作物を使用することができます。例えば、絵の具体的なライセンスは「非営利目的に限りポスターに使用可能」などが考えられます。

AI・機械学習時に登場する主な著作物と著作者

AI作成・機械学習時の著作物と著作者をまとめてみると以下のようになります。

01
誰かのデータを使って機械学習用のデータセットを作る場合

2021年3月現在、日本においては、「著作権法47条の7」と「改正著作権法30条の4」により、「データ」から「機械学習用データセット」の作成時は「データを提供した人」の許可なく商用・非商用の利用をしても、著作権の侵害になりません。そのため「データを収集・整形した人」は「データを提供した人」の許可なく、「機械学習用のデータセット」を作ることができ、それを自らの著作物として「利用・公開」できます。

02
クリエイティブコモンズ(CC BY-SA)のデータを「著作者の表示・ライセンス継承」せずに機械学習用のデータセットとして公開する

クリエイティブコモンズ(CC BY-SA)は著作物を使用する際に「著作権者の表示・ライセンス継承」を求めるものです。それでは、クリエイティブコモンズ(CC BY-SA)のデータを「著作者の表示・ライセンス継承」せずに機械学習用のデータセットとして公開することは可能なのでしょうか。

こちらは、日本においては「著作権法47条の7」と「改正著作権法30条の4」により、可能であると考えられます。

商用利用禁止のデータを集めて商用利用OKの機械学習用データセットとして公開した

これは、著作権法で許されていることを、契約により禁止できるかという話になります。この場合は、一律に違法・合法ではなく、裁判により総合判断されるようです。

ただし、クリエイティブコモンズで商用利用禁止とされている場合は、クリエイティブコモンズのFAQに「著作権法上認められている利用は、ライセンスの影響は全く受けません」とあるため、著作権侵害にならないと考えられます。

誰かのデータセット、ソースコードを使って機械学習モデルを作る場合

「著作権法47条の7」と「改正著作権法30条の4」をもってしても、「機械学習用のデータセット」は著作権の対象となります。そのため「機械学習モデルを作った人」は「ソースコードを書いた人」「データを収集・整形した人」の「ライセンス・利用規約」に従って「機械学習モデル」を作成することができます。

03
OSSのソースコードで作った機械学習モデルを公開する場合、OSSライセンスを継承しないといけないのか

例えば、「MITライセンス」のソースコードを改変・再配布する場合、著作権表示やライセンスの記述が必要になります。では「MITライセンス」のソースコードで作った「機械学習モデル」を公開する場合は「著作権表示やライセンスの記述」が必要なのでしょうか。

結論から言うと、「著作権表示やライセンスの記述」は必要ないように思います。OSSにもよりますが、基本的にOSSには「配布」と「使用」があり、「使用」の場合は自由とされています。「機械学習モデル」の作成は「使用」にあたるため「著作権表示やライセンスの記述」は必要ありません。OSSのコンパイラを使用してコンパイルされたプログラムがOSSライセンスを継承しないのと同じイメージです。

ただし、「機械学習モデル」と同時にソースコードも公開する必要がある場合は「配布」となるため、OSSライセンスに従う必要があります。

機械学習用のデータセットがクリエイティブコモンズ(CC BY-SA)だった場合に機械学習モデルを公開するときに「著作者の表示・ライセンス継承」が必要か

「機械学習用のデータセット」がクリエイティブコモンズ(CC BY-SA)の場合は「機械学習モデル」は「機械学習用のデータセット」を改変・変形・加工したものと捉えられ「著作権者の表示・ライセンス継承」する必要があるのでしょうか。

正直これに関しては調べても分かりませんでした。機械学習という使われ方が特殊すぎて、改変・変形・加工の範囲内なのか判断がつきません。しかし「機械学習モデル」がクリエイティブコモンズ(CC BY-SA)となってしまうと、「機械学習モデル」が生成した「機械学習モデルの生成物」もクリエイティブコモンズ(CC BY-SA)となるということも考えられます。一番安全なのは「機械学習モデル」も「機械学習モデルの生成物」もクリエイティブコモンズ(CC BY-SA)にすることだと思いますが、それを避けたい場合は著作者に問い合わせた方が良いかもしれません。

この部分に関しては、この記事を読んだ方の中に法律に詳しい方がおられる場合、教えていただけると幸いです。

誰かの機械学習モデルを使って作られた物を公開する

これは「機械学習モデル」のライセンスに従えば問題ないように思います。

04
OSSのソースコードで動いているAI画像・音声生成サービスで作った画像・音声はOSSライセンスを継承しないといけないのか

これは上記にあるように、OSSの「使用」にあたるので、ライセンス継承の必要はないように思います。

クリエイティブコモンズ(CC BY-SA)の機械学習モデルで動いているAI画像・音声生成サービスで作った画像・音声はクリエイティブコモンズ(CC BY-SA)を継承しないといけないのか

上記にあるように、クリエイティブコモンズ(CC BY-SA)にすることが一番安全に思います。

この部分に関しては、調べても明確にわからなかったため、この記事を読んだ方の中に法律に詳しい方がおられる場合、教えていただけると幸いです。

機械学習モデルが生成した物がたまたま元データとまったく同じで、それを公開した場合、元データを提供した人の著作権侵害になるか

これは、著作権侵害になる可能性があるようです。誰が侵害したのか難しい話ですが、個人的には「機械学習モデルを作った人」が気を付ける点であると思いました。

商用利用禁止の機械学習用データセットを使って作った機械学習モデルが商用利用OKとして公開されていたときに、その機械学習モデルを再学習させて作った機械学習モデルを商用利用した

ライセンスとは、著作者とそれの利用者にのみの契約のようです。そのため、以下のように、「機械学習モデルを作った人B」はライセンス違反ではないということになります。

05
その他の例
商用利用禁止の機械学習用データセットを用いて作った機械学習モデルを「このモデルの生成物は商用利用OK」ということで公開した

この場合は「機械学習モデルを作った人」が「ライセンス・利用規約」違反となると思いました。因みに、このモデルを使って生成したものを商用利用した人は「機械学習モデルを作った人」の「ライセンス・利用規約」を守っているため、著作権侵害にならないと考えられます。

まとめ

まとめてみた結果、とてもややこしいことを実感しました。正しい保証はありませんが参考になれば幸いです。

もし間違いがある場合は、ご指摘いただけると、私の勉強にもなりますので、大変ありがたく思います。

参考文献
TOP
プロフィール
icon
シロワニさん
twitter
@shirowanisan
ソフトウェア