AI作成や機械学習を行なっていて、著作権周りがややこしすぎると感じたため、自分なりにまとめてみようと思いました。色々な人の参考になれば幸いですが、読み進める前に以下の注意事項を必ず読んでください。
著作権:作品を創作した人が、創作された作品の使われ方を決められる権利のこと。
著作物:著作権の対象になる作品のこと。例えば「絵・音楽・ソースコード」など。
著作者:著作物を作った人のこと。
要するに、「絵(著作物)」などの作品は、「書いた人(著作者)」の許可なく、誰かが勝手にポスターなどに使用すると、「著作権」を侵害することになります。
「ライセンス・利用規約」とは、「著作者」と「著作物を使用する人」との間に交わされる契約のことです。契約者は「ライセンス・利用規約」の範囲内で著作物を使用することができます。例えば、絵の具体的なライセンスは「非営利目的に限りポスターに使用可能」などが考えられます。
AI作成・機械学習時の著作物と著作者をまとめてみると以下のようになります。
2021年3月現在、日本においては、「著作権法47条の7」と「改正著作権法30条の4」により、「データ」から「機械学習用データセット」の作成時は「データを提供した人」の許可なく商用・非商用の利用をしても、著作権の侵害になりません。そのため「データを収集・整形した人」は「データを提供した人」の許可なく、「機械学習用のデータセット」を作ることができ、それを自らの著作物として「利用・公開」できます。
クリエイティブコモンズ(CC BY-SA)は著作物を使用する際に「著作権者の表示・ライセンス継承」を求めるものです。それでは、クリエイティブコモンズ(CC BY-SA)のデータを「著作者の表示・ライセンス継承」せずに機械学習用のデータセットとして公開することは可能なのでしょうか。
こちらは、日本においては「著作権法47条の7」と「改正著作権法30条の4」により、可能であると考えられます。
これは、著作権法で許されていることを、契約により禁止できるかという話になります。この場合は、一律に違法・合法ではなく、裁判により総合判断されるようです。
ただし、クリエイティブコモンズで商用利用禁止とされている場合は、クリエイティブコモンズのFAQに「著作権法上認められている利用は、ライセンスの影響は全く受けません」とあるため、著作権侵害にならないと考えられます。
「著作権法47条の7」と「改正著作権法30条の4」をもってしても、「機械学習用のデータセット」は著作権の対象となります。そのため「機械学習モデルを作った人」は「ソースコードを書いた人」「データを収集・整形した人」の「ライセンス・利用規約」に従って「機械学習モデル」を作成することができます。
例えば、「MITライセンス」のソースコードを改変・再配布する場合、著作権表示やライセンスの記述が必要になります。では「MITライセンス」のソースコードで作った「機械学習モデル」を公開する場合は「著作権表示やライセンスの記述」が必要なのでしょうか。
結論から言うと、「著作権表示やライセンスの記述」は必要ないように思います。OSSにもよりますが、基本的にOSSには「配布」と「使用」があり、「使用」の場合は自由とされています。「機械学習モデル」の作成は「使用」にあたるため「著作権表示やライセンスの記述」は必要ありません。OSSのコンパイラを使用してコンパイルされたプログラムがOSSライセンスを継承しないのと同じイメージです。
ただし、「機械学習モデル」と同時にソースコードも公開する必要がある場合は「配布」となるため、OSSライセンスに従う必要があります。
「機械学習用のデータセット」がクリエイティブコモンズ(CC BY-SA)の場合は「機械学習モデル」は「機械学習用のデータセット」を改変・変形・加工したものと捉えられ「著作権者の表示・ライセンス継承」する必要があるのでしょうか。
正直これに関しては調べても分かりませんでした。機械学習という使われ方が特殊すぎて、改変・変形・加工の範囲内なのか判断がつきません。しかし「機械学習モデル」がクリエイティブコモンズ(CC BY-SA)となってしまうと、「機械学習モデル」が生成した「機械学習モデルの生成物」もクリエイティブコモンズ(CC BY-SA)となるということも考えられます。一番安全なのは「機械学習モデル」も「機械学習モデルの生成物」もクリエイティブコモンズ(CC BY-SA)にすることだと思いますが、それを避けたい場合は著作者に問い合わせた方が良いかもしれません。
この部分に関しては、この記事を読んだ方の中に法律に詳しい方がおられる場合、教えていただけると幸いです。
これは「機械学習モデル」のライセンスに従えば問題ないように思います。
これは上記にあるように、OSSの「使用」にあたるので、ライセンス継承の必要はないように思います。
上記にあるように、クリエイティブコモンズ(CC BY-SA)にすることが一番安全に思います。
この部分に関しては、調べても明確にわからなかったため、この記事を読んだ方の中に法律に詳しい方がおられる場合、教えていただけると幸いです。
これは、著作権侵害になる可能性があるようです。誰が侵害したのか難しい話ですが、個人的には「機械学習モデルを作った人」が気を付ける点であると思いました。
ライセンスとは、著作者とそれの利用者にのみの契約のようです。そのため、以下のように、「機械学習モデルを作った人B」はライセンス違反ではないということになります。
この場合は「機械学習モデルを作った人」が「ライセンス・利用規約」違反となると思いました。因みに、このモデルを使って生成したものを商用利用した人は「機械学習モデルを作った人」の「ライセンス・利用規約」を守っているため、著作権侵害にならないと考えられます。
まとめてみた結果、とてもややこしいことを実感しました。正しい保証はありませんが参考になれば幸いです。
もし間違いがある場合は、ご指摘いただけると、私の勉強にもなりますので、大変ありがたく思います。