生成AIの学習データにライセンス料を（第722回）

AI企業は記事やデータの使用の対価として、報道機関にライセンス料を支払うべきとアメリカの議会が表明したというニュース記事を見ました。この記事の内容について解説しました。

＝＝＝目次＝＝＝
AI企業は学習データのライセンス料を払うべき
学習データに著作物を使うのはフェアユースか
ライセンス料を払える大企業が有利になる懸念
どのみち生成AIがなくなることはない
法的リスクからユーザーを保護するサポートも
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水朝8時に更新

■Twitterアカウント
https://twitter.com/ashikagacast

Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCASTの聴き方
http://typebot.io/ashikagacast

■アシカガノオト
https://ashikaga.substack.com/

00:01

アメリカの議会がテック企業にAIトレーニングデータのライセンス料を払うように求めたといったタイトルの記事が、アメリカのワイヤードの英語の記事にありました。

そこで気になって、DPLで翻訳したり、AIで要約してもらったりしつつ、その記事をじっくり見てみました。

アメリカ上院の校長会で議員らが、オープンAIなどのAI企業が、記事やデータの使用の対価として報道機関にライセンス料を支払うべきというメディア業界の意見に同意したというのが見出しにもなっていた。

これ、校長会ということなので、公に聞く会ですね。いろんな立場の人から意見を聞く会なので、ライセンス料を支払うべきというのもあくまでも意見の段階ということですね。

そして、メディア業界側は、ライセンス契約を結ぶことなくコンテンツを使用することは、特定の条件下で著作物を勝手に使うことを認める、フェアユースでは保護されないことを明確にするよう議員に求めたそうです。

生成AIの学習データに人の著作物を勝手に使うことがフェアユースとして認められるかどうかというのが、生成AIに関する議論の大元にあることですね。

いわゆる反AIと呼ばれている人たちの中でも過激というか、そもそも生成AIを一切認めないという人は、そもそも人の著作物を学習データにしている時点で違法だと、著作権違反だという主張の人が多いですね。

ここの学習データがフェアユースかどうか違法かどうかをはっきりさせないと、次の議論に進まないんじゃないかと感じています。

とはいえ、この今回のアメリカ上院の校長会の話は、ニュースを配信しているような企業がAIを開発している企業に対してライセンス料を払えと言っている話なので、

03:00

我々一般の人たちがネットにアップしている文章だったり絵だったりが勝手に学習データにされたあるいは今後されることをなんとかしろよという話とはちょっと違うように感じます。

ライセンス料を払えと言っているということは、ライセンス料さえ払えば使っていいよと言っていることですからね。

実際すでにオープンAIはAP通信のニュースコンテンツアーカイブをライセンス供与してもらうという契約を結んでいるらしいです。

なおフェアユースというのは日本語にすると公正利用と訳されると思うんですが、著作権者の利害を損なわないなどいくつか条件を満たせば著作物を著作権者に無断で勝手に使ってもいいよというアメリカのルールです。

その条件の中に研究目的だと認められるというのがあって、生成AIが出たての頃に研究目的だからフェアユースというように書いてある記事とかも見かけたんですが、今も生成AIは商用化もしているので研究目的とは言えないと思います。

ただ、AIの学習は表現をコピーすることが目的ではなくパターンを特定することにあるので、権利者の利益を侵害することはないのでフェアユースだというのがAI企業側の言い分らしいです。

そのままコピーしているわけではないですよということですね。実際、学習データそのものをデータベースとして持っているわけではないですし、誰かが作った著作物をコピーしている、盗んでいるわけではないという主張ですね。

オープンAIなどのAI企業は、ライセンスを払えという意見に対して、全ての学習データにライセンス料を払うのは現実的ではないと主張しており、専門家にはそれに同意する人もいるということでした。

強制的に全ての学習データにライセンス料を払うというのは非現実的で、さらにオープンAIとかマイクロソフトのようなライセンス料を払えるお金を持っている大企業に有利になって、新しいAI企業が生まれて成長していくのを阻害すると指摘する声もあるということでした。

06:02

今、AIを開発しているいくつかの企業が著作権的にグレーな状況ながら、どんどん普及させていって、どんどん成長して資金も集めたところで、著作権的なところはライセンス料で、お金で解決すると。

そういうルールが整備された上で、新しい企業が参入するにはライセンス料が必要で、なかなか参入できないというのは確かに不公平感がありますよね。

これ、高度成長期とか1980年代くらいに散々大量生産、大量消費とかをしておいて、今の若者にはエコだとか環境問題がどうとか言って我慢することを押し付けているような感じと似てますよね。

あるいは散々CO2を排出して成長してきた大国が、これから発展していく途上国にCO2の排出量を抑えろとか言ってるのとも似てますよね。

CO2だとかエコだとかそういう話を聞くたびに、私は今の若者だとか途上国の人とかに後ろめたい感じ、申し訳なさを感じています。

で、その校長会の話に戻って、議会はAIがテック企業の力を増幅させる可能性と、ジャーナリズムに対するAIの潜在的な悪影響について非常に批判的であるというようなことがワイヤードの記事に書いてありました。

で、結局のところAIの学習データがフェアユースじゃないと裁判なので今後認められることが増えたとしても、生成AIがなくなるということはないと思います。

写真やイラストなどの素材サイトが画像生成AIの会社を訴えている例がいくつかありますが、結局のところ生成AIの開発禁止とかにはならなくて、ライセンス料を払うとかそういうところで落ち着くんだと思います。

Getty Imagesという素材サイトがステーブルディフュージョンの開発元を訴えてるんですけども、その一方で自分の会社が持っているライブラリーを学習データとして画像生成AIのツールを開発してるんですね。

アドビがアドビの素材サービスのアドビストックのライブラリーを使って学習させた生成AIのアドビファイアフライと同じことですね。

09:09

アドビファイアフライはそうやって権利的に問題のないものだけを学習データに使ってますよとクリーンさをアピールして評価を得てますからね。

アドビストックに全く問題がないというわけでもなくて、最近のWacomの広告に生成AIのイラストが使われている疑惑では、アドビストックに登録してある素材がAIを使ってるよというラベルがついてない素材なのに、

他にも他の人の著作物が勝手に登録されているというケースもあったようです。なので100%著作権的に問題ない潔癖だと言い切れないよねと言われています。

あと直接AIとは関係ないですが、アドビストックに登録している画像に有名イラストレーターの名前を勝手にタグとして入れておいて、そのイラストレーターの名前で検索すると関係ないイラストがいっぱい引っかかるというようなことに対しても運営側のアドビが批判されているそうです。

で以前から私が言ってることなんですが、結局のところ生成AIで作られた画像そのもので著作権的なことは判断するしかないんじゃないかと思います。

使う人次第で画像生成AIが新たな創作の手助けになるツールにもなればパクリ製造マシンにもなるんじゃないかと考えています。

ただ悪気はなくても生成したものが既存の著作物に偶然あるいは学習データのそのまんまが出てしまって、似てしまったけど生成した人が気づかずに世に出してしまうというケースがあると思います。

そういう時に生成AIの開発側がちゃんとカバーしますよ面倒見ますよというようなことをアドビはアドビファイアフライの企業向けのエンタープライズ版で訴訟とかになっても保証すると言っていますし

マイクロソフトもグーグルも法人サービスのユーザーに対して訴訟リスク法的リスクから保護する制度というのを用意しています。

まあともかく反AI的な人は人の著作物を勝手に学習データにしている時点で違法だという主張の人が多いのでそこをクリアにして次の議論に進められるようにしてほしいと。

12:09

そこがクリアにならないと反AIの人とAI推進派の人の意見が最初の時点で噛み合わないのでその辺クリアになっていって安心して生成AIが使えるようになっていったらいいなと思っています。

今回は以上です。アシカガコウジがお届けしました。

総スター数

エピソードをシェアする

Instagram シェア画像

埋め込みプレイヤーのカスタマイズ

プレビュー

カラーテーマ

メッセージを送信

アシカガコウジ

感想

ギフトを贈る

気持ち

花

飲み物

食品

顔

動物

ギフト

ギフトを購入

総スター数

コメント

感想を書く