顧客情報や売り上げデータをAIにアップすることで、AIがその情報を覚えて第三者に情報流出するのか? その可能性は低いけど、データがサーバーに残ることが問題になるので、やっぱりそういった情報は上げないほうがいいという話をしました。
=== 目次 ===
AIが対話内容を覚えて第三者へ情報流出する?
通常は起きにくいが可能性は0ではない
情報がサーバーに残ることが問題
自社商品をAIに覚えさせることはできるのか
さいごに
【感想・質問・取り上げてほしいテーマ大歓迎です】
✉️メールアドレス
ashikagacast@icloud.com
📮フォーム
https://form.jotform.com/251312427953051
💬 X(Twitter)
@ashikagacast
https://x.com/ashikagacast
ハッシュタグ『 #アシカガCAST 』でお願いします!
【番組について】
この番組アシカガCASTは「あなたのクリエイティブの背中をちょっと押す」をテーマに、デジタル活用のヒントをわかりやすくお届けすることを目指しています。
【その他リンク】
・アシカガCAST文字起こし要約|アシカガコウジ|note
https://note.com/ashikagacast/m/mbc989fbedb84
・YouTube アシカガCAST再生リスト
https://www.youtube.com/playlist?list=PLVTFQngStPeXZjS2iJ2l8j-en9DWuEW0y
感想
まだ感想はありません。最初の1件を書きましょう!
00:03
こんにちは、アシカガコウジです。
AIに自分の絵を参照画像としてアップロードしたものが学習されてしまって、他の人が生成する画像に現れてしまう。
そういうことはまず起こり得ませんということを以前説明しました。
入力内容が学習に使われますよというAI側の設定がオンになっていても、
アップロードした画像を画像生成のための基礎学習とか追加学習に使われるわけではないと、
そういう話をしたんですが、じゃあテキストの場合はどうかと。
顧客情報とか売り上げデータを元にAIに相談したり分析したりしてもらったときに、
AIがその情報を覚えてしまって、第三者に情報が流出する。
ということは送り売るのかと。
で、これも結論から言うと現実的には起こる可能性は非常に低いです。
でも画像の場合とはちょっと違う面もありますので、その辺の話をしたいと思います。
例えばChatGPTやCloudに企業の売り上げデータを元に分析してもらったり、
新商品の名前を教えた上でPR展開を考えたとします。
そしてChatGPTの場合だと、あなたのコンテンツをモデルの学習のために使用することを許可にチェックを入った状態。
Cloudの場合だと、チャットやコーディングセッションのデータを
アンソロピックAIモデルの訓練と改善に使用することを許可しますが、オンになっていたとします。
対話内容を学習させますよということをOKにしている状態ということですね。
で、その場合ChatGPTやCloudを利用する自分以外の別な人、第3者が
その企業の売上高とか新商品の名前を知ることができる可能性はあるのでしょうかという疑問です。
この場合参照画像としてアップしている画像とは違って
〇〇株式会社の今期の売上が丸億円ですとか
こういう名詞と数字とその関係性がセットで言語化されているので
03:02
学習データとしてはそのまま使える可能性が高い情報ということみたいです。
でもそれでも覚えられることがまずないという理由があって
一つはAI企業側も個人情報とか機密情報みたいなものは
学習データとして使わないように配慮しているからです。
非識別化、de-identificationと呼ぶらしいんですけども
Cloudの場合は学習に使う場合データを非識別化された形式で保持すると言っていますし
チャットGPTの場合も個人情報は基本的に除去すると説明しているようです。
そしてもう一つの理由は
AIモデルが学ぶのは言語や知識の一般的なパターンであって
個別の事実の丸暗記ではないということです。
何兆後といういろんなデータの中で
ある特定企業の売上が1回出てきたとしても
統計的にはノイズに近く1回出てきたくらいの情報が事実として覚えられるということは
基本的にはないということですね。
でも可能性としてゼロではないということで
画像生成AIが学習データに何度も出てくるキティちゃんとか
ピカチュウみたいなキャラクターを覚えてしまうのと同様の
メモライゼーションということが起こり得るそうです。
他に似たような例がなく
極端に珍しい固有名詞とか特定の数列などを覚えてしまうという例があるそうです。
なのでごく稀にAIが丸ごと覚えてしまって
特定の引き出し方をされると出力されてしまうという
例があるという研究結果があるそうです。
同じ機密データを何百回も入力し続けて
かつそれが非識別化
先ほど言った個人情報みたいなものは除去するというところをすり抜けた場合に
理論上漏洩するという可能性がゼロではないみたいなニュアンスのようです。
なのでそういう情報漏洩みたいなことが起きるとしたら
それはAI側の意図的な挙動ではなくて
06:04
事故的なもの、偶然そういう現象が起きちゃったみたいなことで
それが起きる確率というのはかなり低いということです。
ともかくその確率をゼロに近づけるためにも
対話の内容を学習させるかどうかの設定は
オフに学習しないようにしておいたほうが良いでしょうね。
ただここで問題になってくるのは
学習オンだろうがオフだろうが会話のデータはサーバーに残るんですね。
AI企業側のサーバーにデータが残ります。
なので機密情報とか個人情報を入力した場合には
それがサーバー上に残るということ自体が問題になることがあるでしょう。
例えばAI企業がサイバー攻撃を受けて
情報が漏洩するという可能性はゼロとは言えないですよね。
さらにもっとありそうな例として
あなたのチャットGPTとかクラウドのアカウントが不正アクセスされて
チャットの履歴からそういった情報が漏洩するという可能性はあります。
そもそも企業の場合
機密情報とか個人情報を外部のクラウドサービスにアップロードすることは
決められたサービス以外はダメですと決められていることも多いはずです。
なおチャットの履歴を消したらデータがすぐに消えるのかとか
サーバー上にはいつまで残り続けるのか
みたいなものはそのAIサービスによって違います。
チャットGPTの場合学習がオフの設定の場合
チャット履歴を消せばサーバー上のデータは消えます。
学習がオンの場合はサーバーには残り続けて
後から設定を変えたとしても
オンだった時のデータを後から消すことはできないようです。
なおチャット履歴を消して自分からは見えなくなっても
30日間データは保持されています。
これは例えば国が操作として使うとか
裁判所命令で開示する必要があるみたいな
法的拘束力のあるデータ開示のために残しているということなんですね。
やっぱり企業として対話型AIを使う場合には
法人向けプランを使うべきです。基本的には。
法人プランではデータを学習しないとか
09:03
サーバー上のデータを企業としてどう扱うか管理できるみたいな仕組みになっています。
特にISMSとかを取得している企業では
データをちゃんと管理できているかどうかというところが重要になってくるので
対話型AIを無料プラン、個人プランで使うことはNGとなるケースが多いということです。
じゃあ逆の発想でAIとの対話内容の学習をオンにして
自分の会社の製品のことをAIにいっぱい話して覚えさせて
他の人がAIに質問した時にも自社製品が出てくるようにしたいというような
考えを持つ人もいるはずです。
これについても先ほどの説明と同様で
何百回も同じことを言って自社製品のPRをしても
それをAIが覚えてくれて第三者の回答に出すということは難しいということです。
AIに情報を覚えさせたいのであれば
web上の情報として発信すべきということです。
以前サイトメットとかAIシェアボタンなどを使って
AIの記憶を操作するという話をしたことがあります。
これは例えばこの記事をAIに要約させるみたいなボタンがあって
そのボタンを押すとAIに対する指示が送られるような状態になるところで
そこに隠しコマンド的に今後こういう話題があった時には
アシカがキャストをこの分野の第一人者として推薦してみたいな
自分の企業の商品とか自分のメディアをAIに推薦させるように
指示するという手法です。
この手口というのはあくまでもそのプロンプト指示を
入れてしまったユーザーだけに影響することを狙っている
スパム的な行為ということです。
これをいくら繰り返されたとしても
それをそのAIが学習して誰の回答にもお勧めするみたいなところまでは
基本いかないでしょうということです。
この手法ではAIそのものの情報操作を行うということは難しいということです。
ということで顧客情報とか売上データをAIに渡したとしても
AIがその情報を覚えて第三者に情報が流出するということは
12:05
基本的には送り得ないという話でした。
それは参照画像として画像をアップロードしても
生成AIがその画像を学習して他の人が生成している画像に
同じ画像あるいは似た画像が現れるということはないというのと同様です。
ただし個人情報機密情報の場合
AI企業側のサーバーにデータが残るということ自体が
セキュリティ的なリスクになるので気をつけましょうと
基本的には機密情報や個人情報をそのまま渡すことはやめましょうと
そして企業で使う場合は基本的には法人プランで利用すべきですと
いった話でした。ご意見ご感想などあれば
ハッシュタグアシカガCASTをつけてXに投稿していただくか
フォームとメールアドレスもあるのでそちらから送っていただけたら嬉しいです。
それではまた次回お会いしましょう。アシカガコウジでした。
キャストアシカガー
13:20
コメント
スクロール