オープンAIとニューヨークタイムズってもともとライセンス契約の交渉をしてたんだよ
でそれが決裂してその決裂したことでニューヨークタイムズがオープンAIを訴訟したっていう流れになってて
でこの裁判っていうのは今も継続中なのよ
まだ続いてるんだ。まだ続いてる。
でニューヨークタイムズが求めたものっていうのが高額なライセンス料を求めてて
これは他の出版社よりもかなり高い使用料っていうのを要求してきたわけよねニューヨークタイムズが
でAIの学習に使うのも禁止するみたいな制限を設けるみたいな条件を出してきて
それに対してオープンAIがいやいやそんなんちょっと受け入れられないですよみたいな感じになったことで交渉が決裂したわけよ
これ大前提としてニューヨークタイムズがオープンAIに勝手に使うなよっていう話だよね
そう勝手に使うなよっていう話でなんでそのわざわざ裁判まで起こしたのかっていうところで
この著作権を語る上で非常に重要なフェアユースっていう考え方があってこれに決着をつけるために裁判したって言われてるのよ
でこのフェアユースとは何かっていうとアメリカの著作権法上では一定の条件下で著作物を許可なく使ってもいいっていう例外規定なんだよね
でこれ4つの規定があるんだけど一つ目が目的と性質商業目的か非営利かあとは変容性があるのかみたいな内容で
でコッペみたいな感じでそのまま使わなければ大丈夫でしょみたいなのがこのルールで
でオープンAIはテキストを重みという数値のベクトルとかに変換してさ人間が読めない形で使ってるわけじゃん
だからこれ変容性あるよねっていうふうにオープンAIは言ってるわけよ
でもニューヨークタイムズはそもそも商業利用だししかも生成物がその記事をそのまま再現するみたいなことも実際にあるわけじゃん
だからこれ変容性とかないでしょみたいなことを訴えてるみたいな
論点が違う感じだね
あとは著作物の性質これが事実系かクリエイティブかみたいなところがあって
でオープンAIはニュース記事って事実報道が多いじゃんで創造性が小さい
だから平気でしょって言ってるんだけどニューヨークタイムズは報道でも文章表現というのはもう創作物だし
あとスクープ記事っていうのはある意味オリジナル性が高いって言ってるわけよ
ここでまた揉めてると
3つ目が使用量と重要性これどれぐらいの量を使ったのかそれ使ったものは大事な部分なのかっていう視点
でオープンAIは量は認めてるわけよAIの学習で一部だけ取り込んでもさ文章とか文脈って学習できないじゃん
だから全文コピーが必要だからこれは確かにいっぱい使ってもらってますと
でもAIが最終的にユーザーに提供するものって革新的な部分じゃなくて新たに作られた別のコンテンツじゃん
だから重要な部分っていうのは使ってないよみたいなこと言ってるんだよね
でもニューヨークタイムズはいくら技術的に必要とは言っても全文無断でコピーするのはフェアユースとはさすがにやりすぎじゃないのっていうのを言ってるわけよ
だから使うならちゃんとライセンス料払ってよ金払ってよっていうことだよね
そうそうそう基本的にはねでもオープンAIとしてはそのフェアユースっていう考え方があるから
いやこれ例外規定に則ってるんだからそもそも別にオタクの著作権侵害してないよっていうのをオープンAIは言ってる
あとは市場への影響これは要はそれを出すことによって元の創作者の利益を損害しちゃいけないっていう話があって
チャットGPTは元記事の代替えとはならないし要約でトラフィックも送ってるでしょみたいな
当時は要はライセンス契約してみたいなのがそもそもなかった時代だから
ライセンス市場が成立してない時に使ってるんだから別に損害もないよねそもそもみたいな話をしてて
ニューヨークタイムズは普通にうちの公読とか広告資料を直接奪うよみたいなのでやりあってるみたいな
この4つの視点がフェアユースの理由をだから生成への学習がそのフェアユースなのかっていうのが基本的に争点として争われてて
ニューヨークタイムズはこれをフェアユースにしちゃまずいでしょっていうことを改めて争うためにこの裁判を起こしたみたいな
これいつ
これはね2023年の末頃に結構前に始まった裁判が未だに続いているっていうような状況
特にオープンAIとしては変容性の部分と市場非代替性っていうところを最重要視して争ってるんだけど
これ何かというとgoogle booksっていうのが過去の範例としてあってそれを引き合いに出してるんだけど
google booksっていうのはgoogleが大学図書館と提携して造詞を全文スキャンしてデジタル検索データベースっていうのを構築したと
検索結果には最大3つのスニペット要約みたいなのが出てきて原本の全文は一般人さんに見せないみたいな仕組みなのよ
だから本当に今のgoogle検索みたいなものを使った大学の図書館のやつがあって
これに対してその著作者の許可なく数千万冊を複製してしかも営利利用してるからこれはもう著作権侵害だっていう形で
著作権者が集団提訴みたいなのを起こしたっていうのが過去にあって
これは最終的にフェアユースっていうことでgoogleが勝訴してるんだよ
だからオープンAIもLLMも同じロジックで同じでしょみたいなことを言ってるっていうのが今の裁判の図式
さらにオープンAIって最新の政府向けの提言とかでも学習する自由を守らないとアメリカの競争力が脅かされると
だから今のその著作権体系のフェアユースの考え方を意識してさらに言ったらもっと拡張してた方がいいっていう風に訴えてるっていう
元々全体的な傾向としてはどちらかというとニューヨークタイムズ側の考え方が結構アメリカでも主流だったわけよ
だからさっき話したアメリカの著作権局の局長が解任されたっていう話あったけど
その局長は意見書でこのフェアユースが今の生成家のトレーニングではフェアユースを超えているっていうことを提言してたわけよ
だからニューヨークタイムズ側っていうのが結構一般的なところであったんだけど
そのタイミングでトランプさんが局長を解任したわけよ
だからここから傾向としてはこの学習の部分でいくと基本的にはある程度こう自由に学習してってもいいんじゃないのみたいな方向に流れそうだなっていうのが今のアメリカの傾向なのよ
トランプさんがさ著作権長の局長さんを解任したと
これもしかしたら裏でニューヨークタイムズが意図を引いてたとかそういうケースもちょっと考えられそうだね
あっ意図を引いたそういうことで今日の局長に働きかけてそういうのをやってくれみたいなことをニューヨークタイムズ側がやってたってことか
そうそうそう
ああなるほどね
いわゆるこの裁判で勝つために明らかに有利になるじゃんこれが受理されたら
そうだね
でも確かに競争力が弱くなるよねっていう意見の方もわかるんだよね
だってそのフェアユースっていうのが何のために存在しているのかっていうことを考えるとちょっと利権寄りな考え方もあるなと思ってて
そうだね
そう思うと確かにトランプさんだったら解任しそうだなってちょっと風に落ちたっていうか気はしましたね
そうだね今結構そのフェアユース拡張派とクリエイター保護派っていうのがほんと今もう綱引き状態で
クリエイター保護派がちょっと強かったところがフェアユース拡張派に今結構流れそうっていうのがアメリカの状況
さらにAIによる出力の部分でいうともう一個重要な法案が進んでて
これがディープフェイク対策のノーフェイクス法案っていうもの
ノーフェイクス法案
そうこれ4月9日に議会にこの法案が再提出されたんだけど
要は本人の同意なしに声とか肖像を真似た作品を作成することを禁じるっていう
要はパブリシティ権っていう肖像とか名前で稼ぐ権利を守ろうっていう権利なんだよね
だからアメリカとしては学習は結構自由にやっていいよと
でも出力するものは人の権利を返すなよみたいな
なんかそういう感じの方向性
なるほどね
そうただ世界的な流れとしてどうなのかっていうと
学習データの透明性っていうのが結構スタンダードになりそうな雰囲気が最近は出ているのよ
そうなんだアメリカとはちょっと違うんだ
これはやっぱりEUのEUのAI法っていうのは結構大きくて
これ学習データの要約リストみたいなものを公開するっていうのを義務化してるのよ
これが2025年8月から実際に学習データのリストが公開されるのがスタートされる期日になってて
オープンAIとかそのあたりもやっぱりこの辺はちゃんとやってくるだろうっていうふうに今見られてるんだよね
でリストはテンプレートみたいなのがあるからURL完全公開って形ではないんだけど
カテゴリーごとのサマリーみたいなものを今後公開しなきゃいけなくなると
でイギリスはねもともと逆EUって言われるぐらいゆるゆるを目指してたのよ
基本もう自由に何でも使っていいよと
だけど権利者がオプトアウト
これは使わないでってNG出したら出したものだけは使わないようにしようみたいなことをやってたんだけど
それに対する反対意見がめちゃくちゃ多くて
AI企業による著作物利用の透明性を強化するっていう修正案を上院が12日に採択するっていう形で
もう法案が進んでるんだよね
今月の?
そう今月の
他にもポールマッカートリーとかそういった有名な人たちがイギリスの首相に対して書簡を送ったりとかっていうのをしてて
イギリスも結構そういうのを厳しくしていこうっていう方向に今寄り始めてるのよ
そうなんだね
だから比較的アメリカとは違う流れになってる
でグーグルとかさオープンAIとかそういったプラットフォーム側がさEUの規制に合わせてさそういう学習元とかのデータを出さなきゃいけなくなるわけじゃん
どうせさそのEU向けにそういったまとめ作るんだったら
グローバルで同じフォーマットを使う方がコスト的にいいよねって判断する可能性って全然あるじゃん
でなるとその市場観光みたいな形で学習が透明化されているものっていうのが国際的なスタンダードになっていくっていう可能性は十分あり得るなっていう風に思ってて
なるほどね
まだわかんないけどね確定とかじゃないから
こういったものを学習しましたよっていう提出するフォーマットをグローバル化しようって話
そうグローバル化しようっていうかEUはそれをもしないとEU向けに展開できないってのはもう法律で決まってるから
なるほどね
で各社がそれをしてグローバル化がそういう状態になったらなんかもう別に国際規定みたいなので決まってるわけじゃないけど
もうそれが国際的なスタンダードだよねっていう風にもう実態としてなっちゃうじゃん
同じルールでいくんであればね
なるほどですね
なのでそれを踏まえた上で
じゃあ企業とかAIを使って何か制作してる人が著作権に対してどういう対応ができるのかっていう話になると思うんだけど
これちょっと最後に紹介しようかなと思いまして
文化庁がAIと著作権に関するチェックリストとガイダンスっていうのを出してるんだよね
だから基本的にはこれに準じてやるのが一番安全
でAI開発者、AI提供者、AI利用者、業務外利用者ってそれぞれのパターンに細かく書かれてるんだよ
だから全部紹介するのは難しいから
一応AI利用者っていうところでちょっと気になったところを抜粋しようかなと思ってまして
生成AIの仕組み及び特性を理解するっていう項目があるのよ
これは仕組み上学習データに含まれる既存の著作物と類似した生成物が生成されることがあると
ジブリ風とかもそうですよね
そうでこれを利用者が既存の著作物と認識してなくても
生成利用が著作権侵略になることがあるって書かれてるんだよね
だからそのジブリを知らない人がジブリ風を作って
ジブリって存在するんですかみたいなっていうことですよね
アウトみたいな
みたいなことですよね
それ聞くとちょっと怖いなって思うと思うんだけど
これね多分要するにロラとかのことなんだと思うのよ
なるほど
著作権侵害になるかどうかって
類似性と異挙性っていう2つを満たしているかどうかで判断されるっていうのがあって
類似性っていうのは要は作品の見た目が似てるかどうか
異挙性っていうのは既存の作品を元にして生成物を作ったかどうかっていう
この2つが見られてこの2つが合わさった時に著作権違反になるわけよ
これでもセットじゃない基本
基本セットだから要はこれを元にして異挙してて
かつそれが似てて類似しているかどうか
だから何かを参考にしても
製作物が全然違ったら類似性が違うから著作権侵害にならないし
なるほどね
だからめちゃくちゃ似てたとしてもそもそも元のもの知らないんだったら仕方ないじゃん
それは著作権侵害にならないんだよ
なるほど
じゃあなんでさっきの知らずに作ったやつが
その著作権侵害になっちゃう可能性があるのって話じゃん
これがたぶんロラとかの部分で
要するにロラってさ既存のキャラとかを学習させて意図的に似させるように作ってるじゃん
あれですねそのディフュージョンとかで使われるやつですね
そうそうディフュージョンとかでやる追加学習みたいな形で
キャラクターにめちゃくちゃ似せれるように学習させることができるわけですよね
そうですね特定のポーズとか
とにかく学習データをもとにそのまま吐き出すっていうようなものですよね
だからここで異虚性が成立しちゃうんだよね
しますね確かに
だから極端な話例えばドラゴンボールの悟空に似せるロラみたいなファイルがあったとして
悟空たまたま知らなくてなんかこのムキムキマッチョのキャラクターかっこいいみたいな感じで使って
めっちゃオラソン悟空みたいな画像を作ってしまったらそれは著作権侵害になるといくら悟空知らなくても
そりゃそうだね
まあそうなんだよねそりゃそうだろうって話なんだよね
いくらでも言えるもんね
そうだからこの文化茶の書き方を見るとちょっとその画像生成するの怖いって思いがちなんだけど
そこまで怖がる必要はないかなっていうふうには思ってて
例えばジブリ風とかはグレーかなと思ってて
そもそもチャットgptってさ画像生成ランダム性があるじゃん
たまたま似ちゃったってその似ちゃったものの元のものを知らなかったらこれは基本的にはセーフだと思うのよ
なんだけど一応チャットgptって個人の作風は模倣しないように制限をかけてるっていうふうに明確に言ってて
でこれね絵や著作権に関する考え方のところでも書かれてるんだけど
学習に用いられた著作物の創作的表現が生成利用段階で出力される状態となっていないと
法律的に評価できる場合は著作権侵害にならないって言ってて
要はチャットgptみたいに既存のものをめちゃくちゃ学習してるじゃん
だけどこの人の作風に似せて作ってって言ったらそれは出さないっていうふうに明確になってるじゃん
だからもうこれ明確になってる時点でこのツールで作ったとしても著作権侵害ならないよねっていう話なんだよ
なんだけどオープンAIが前回4オーイメージジェネレーションの回でも紹介したけど
個人的な作風はNGにしてるんだけどスタジオ全体の作風はokにしてる
スタジオジブリっていう作風はokにしてますよみたいなこと言ってるんだよね
だからこれが日本の法律的にはいやそれはNGじゃないのみたいな判定をされる可能性はちょっと少し残ってる
それ普通に異虚性としてスタジオジブリめちゃくちゃ参考にしてスタジオジブリ作ってるよねみたいな
っていうのがあるからちょっとグレーゾーンだなやっぱりジブリはっていうところを感じる
グレーだね確かにそうなんだねグレーゾーンなんだよ
ナウシカを直で出したらアウトだけどフーだったらそうそうそうそう
okだよ
オープンAIもそういう風に言ってるんだよこの作品のこのキャラクターのとかじゃなくてスタジオジブリっていう世界観を表現するだけみたいなことを言ってるから
だから一応okって扱いにはなってるみたいな感じなんだよね
さっきの法律に当てはめるとちょっと微妙だよねみたいな
ちょっと微妙だよねって捉え方によるよね
捉え方によるね
でも今回そのようは文科庁がさこの今の現行法の解釈の仕方を出してるって言ったようにやっぱ法律って解釈の話だから
だからやっぱりこれが本当に違法なのかどうかっていうのはやっぱり弁護士だったり過去の判例とかをもとに争うというか検証していくものだから一概には言えないよねここはっていうところ
でもジブリはokって言ってるの
ノーコメント
ノーコメントなんだなるほどねそう
微妙だね微妙だね
なるほどね著作権むずいね
そうね著作権だからむずい
さっきの話で言うとイメージとイメージあるじゃん元のものを読み込ませて何か新しいものを作るみたいな
これも別に著作権物を読み込ませる分には全然問題ないんだよ
これは日本のtdm例外に準ずるから学習のためだったらもう好きなだけデータ使っていいですよってのがあるから全然自由にそれは使ってもok
なんだけどそれでもそれにめちゃくちゃ似たものを出しちゃったらそれはアウトだよねっていうところでこの異教性と類似性の両方が合致するかどうかっていうのが結構重要なポイント
まあ個人で楽しむ分ならいいけど商用だったり外に出したりとかsns公開したりとかそんなときはちょっと怪しいよね
怪しい
だからまあ基本的にその作る側からしたら真似しようと思って真似したのかどうかだけを基本的には注意すればよくて
ただ一般的なユーザーの視点でいうとどちらかというとそのチャットGPとかで作れるようになったから作りましたみたいな人って多いじゃん
そういう人やっぱそのツールがどういうふうなもとでやっているものなのかっていうのはやっぱりちゃんと理解した方がいい
確かにね
ステイビルディフュージョンとチャットGPの画像生成の違いってどう違うのっていうのはやっぱりしっかり勉強すべきだし
チャットGPではそういえばランダム性がある
でもステイビルディフュージョンやローラーっていう追加学習の機能があって本当にそっくりなものを出すことができるみたいな
意図的に出せるってことですよね
そうそうその違いとかをちゃんと理解する必要があって
デザイナーとかってさきっとある程度その著作権とか法律の部分って弁護士並みに100%理解してない人もやっぱ自分の仕事にかかることがある程度理解してると思うんだよね
当然だけどこの画像生成とかが使えるようになったタイミングで使えるから作りましたみたいな人って著作権の頃から一切知らないと思う
なんかどうなんだろうぐらいだよね
でも自分の仕事周りの法律をある程度理解するって当然当たり前じゃん
我々ってメディアやってるからさそういった広告に関するさ法律とかPR表記とかっていうのはある程度把握するわけでさ
でもやっぱそれがその画像生成ができることによってそこをステップを飛び越えて制作者になれちゃうっていうところがちょっと怖いところで
確かにね そうそうそう
今僕らの配信でさ画像生成への全部の細かい違いを伝えてで弁護士並みに著作権の正しいものを伝えて絶対無理じゃん
でもやっぱ画像生成してそれを表に出すってことをする以上はやっぱ自分の使っているツールがどういう性質のツールで
で著作権としては最低限知っておかなきゃいけないレベルって何なのかっていうのは把握した上で表に出すべきっていうのが今の見解ですね
なるほどですね
とりあえず総括すると学習に関しては日本はめっちゃ緩いと
めっちゃ緩い
で出す分には似てるとアウトだよっていう感じですね
で各国だとアメリカ以外は基本透明性求められていると入力も出力も結構厳しいと
厳しい
アメリカは入力緩いけど日本ほど緩くはないって感じですね
フェアユースっていう条件に基づいてればっていう
出力に関しては同様に