先週 Googleがですね 新しいAIのモデルを出したっていうところで
Birdっていうサービスで それが使えるようになったっていうのがあったんですけど
その関連のニュースが引き続き続いていたなっていうのが ニュースの一つですね
そうですね 結構ここは非常に話題性が高いので 今週もっていう感じですね
とりわけあれなんですかね 日本語対応で日本のGoogleワークスペースと
Gmailとかと連携するみたいなところも 機能として加わったというか
オープンになったところが多分今週あったので その辺のいわゆる仕事上
GoogleのAIアシスタントのBirdが ワークスペースとGoogleワークスペースと連携して
いろいろ使いやすくなったよみたいなところも 結構話題があったのかなと思いますね
より使いやすくなって いろんな人が触って 記事が出てっていうところで
拾われているのかなっていう感じですね
そうですね
もう一つ 先週話した内容が また引き続きっていうところなんですけど
音楽の生成のAIですね 数のAIっていうものがあって
これが数のAIですね 数のAIというものがあって
すごい精度のいい作曲なのかなを してくれるサービスなんですけど
これがマイクロソフトが出しているコパイロットと 連携する用ということも相まって
今週も引き続き記事がいっぱい出ていたなっていう感じですね
そうですね この辺のところはやっぱり いろいろ応用が効くみたいなところもあって
非常に引き続き話題性が高くついてますよね
そうですね
これだけ騒がれていますので 非常に品質もいいということで
ぜひ皆さんも触ってみてくださいっていう感じで ちょっと簡単に話したいと思います
あとはですね 技術的にというか テクニカル寄りのニュースが今回ちょっと多いかなと思うんですけど
なるべく分かりやすくしていきたいと思います
まず一つはですね 大規模言語モデル ChatGPTみたいな
いわゆるLLMというものがあるんですけど
そういったものですね
の中で数理科学問題に挑戦するような ちょっと新しい仕組みというか
何か出てきてちょっと話題になってるという感じですね
そうですね 今まで解くのが難しかったようなところも
大規模言語モデルをうまく活用 学習させると解けるみたいなところがありまして
その辺のところでまたより進化をするんじゃないのか みたいなところで非常に話題でしたね
うんうんうんうん
特にその分野でいうと いわゆる計算みたいなところが苦手ではあるんですけど
そこが数学者の人たちと一緒にコラボレーションすることによって
答えをまんま出すというよりかは 答えを導き出す方法を考えてくれるみたいなものが登場してきて
新しい変化が見られたなっていう感じですね
うんうんうん
ちょっと技術的なところはあんまり話してないので ちょっとこのぐらいでいこうと思います
はい
次は割と大音といえば大音なんですけど
AIって基本的に喋るための学習データっていうのが 必要になってくるんですよね
喋るというか出力する内容ですね
そのデータの中に あまりいい話じゃないんですけども
児童虐待の疑いの画像が含まれていて ちょっとまずいねというような話が出てましたね
そうですね
この辺はやっぱり大量のデータを食わせるっていうところで
もちろんそのデータをある程度機械的にフィルタリングする みたいなところがあるんですけど
今回StableDiffusionに使われてるデータって Lion5bっていう50億枚ぐらいのデータセットを使ってるんですけど
それを50億枚を全部本当に正確に目視できるかっていうと なかなかそこが難しいみたいなところがあって
そのうちに今回だと約1000枚ぐらい そういう非常にまずいのではないかっていう画像が
入っていたみたいなところが話題になっていて
こういうものって今後AIが進化していくにあたって 今回は画像だったんですけど
動画とか音声とかテキストとかも含めて さまざまな本当にいい学習データを使わないと
やはりいろいろな問題が起きてしまうとか そもそもその学習されたものに課題があったみたいなところは
今後いろいろそのAIの安全性みたいなところが問われている中で
どんどんどんどんよりいい歩行に向かっていくのかなとは思っているんですが
そういう現状はやっぱりそういう問題をはらんでいたりする可能性が
どうしても否めないみたいなところがあったような トピックになっているのかなと思っています
やっぱり全てが全て 膨大なデータを取り扱う必要があるので
チェックするのが難しいっていう前提のもとで 利用者の方もそういったことがあるよという
リスクの再確認ができたのかなというのが 今回のニュースでしたね
そうですね
はい その学習とか権利回りの話に関連して言うと
もう一つニュースとしてはですね
AIの著作権問題みたいなところで 文科庁がどういうふうに考えたらいいのかっていうところの
案を提示した まだ確定とかではないんですけど 案を提示したっていうのが話題となっておりましたね
そうですね 日本だとやはり著作権法上 結構そこの部分を学習させるデータでは
もう使っていいよみたいなところは あまりにもちょっとフリーダムになりすぎるんじゃないのか
みたいなところの懸念点等々もあって そこがある程度ガイドライン もしくは現状の法律に沿った形で
何かうまくそこの部分の権利を守りつつ 発展に寄与できないかみたいなところは
いろいろ検討されている最中だなという感じですね
取り立てて 今までと全然全く違う考え方が出されたというよりかは
徐々に法整備っていうんですかね 整備が進んできているなっていうところなので
もう少し時間が経つときれいに整理されていくんじゃないかな というところで眺めている感じですね
その他には ちょっと技術的なところを サラッとやっちゃおうかな
ここはあんまり深いところには立ち入らないんですが 大規模言語もあるおすすめですし
先からいくつか出てきてるんですけど