1. こわんこわんこ チャンネル
  2. k90 AIアーティストの話を聞き..
2023-01-09 06:11

k90 AIアーティストの話を聞きました

AIアーティスト窪田望さんの話を聞きました。
アーカイブがあるのでどうぞ。
https://twitter.com/palacademynft/status/1610162271120134144?s=46&t=7Tyn0U6ktL2tYng5vTNmfQ
#web #NFT #AI #窪田望さん
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/630fdd5d8b069b4d0f9c1c3f
00:05
おはようございます、こわんこわんこチャンネルを始めたいと思います。
先日、パルアカデミー、パルパルさん主催の勉強会がありました。
今回、第5回目ということで、AIアーティストの久保田臨さんが登壇されて話をされていました。
この時の話をしたいと思います。
AIというのは皆さんどういうイメージを持たれていますかね。
私は最初、映画とかであまり良いイメージはなくて、
人がAIによって支配されるというふうなことをイメージしていたんですけれども、
最近ではイメージが変わって、AIに助けてもらいながら色々作業していくということが大切かなと思います。
ご存知の分野では、ミッドジャーニーであったりとか、ステイビルディフュージョン、
作曲であったらサウンドドロー、作詞であったら仕掛け、
文章作成であればキャッシーなど、色々今AIを使って便利なことができるということが増えてきています。
個人で人にお願いするとコストがたくさんかかったりすることになるんですけれども、
でもこういったものを使うと安く簡単に素早くできるということが魅力的ですね。
こういったAIという技術をうまく利用しながら時間を短縮していくということがこれからは大切になってくると思います。
本題の方なんですけれども、AIには領域特化型人工知能、アーティフィカルナローインテリジェンスというのと、
汎用型人工知能、アーティフィシカルジェネラルインテリジェンスというのは2つあります。
iPhoneで使用しているSiriは音声を入力することで返答が返ってくるということなんですが、これは画像処理することはできないですね。
だから音声であったり文章であったり画像であったり、こういったそれぞれ分野が特定されているという部分は領域特化型人工知能と呼ばれています。
03:10
今回話があった久保田さんは汎用型人工知能ということで、画像であったり音声であったり幅広く適用されるということで、何かに限定される仕組みではないというところですね。
汎用型人工知能というのは、いろいろ設定があるようなんですが、前処理、モデル、ハイパーパラメータというのを一個一個設定することで処理していくということなんですが、
こういった項目のものを一個一個設定していくわけなんですが、どうしても頭で価値にならないように調整する必要があるんですが、学習率を設定して最適な状態にとどめておくというのがアーリーストッピングという層なんですが、
途中で止めるというような概念のようです。
頭で価値にならないように学習率を設定して最適な状態で止めておくというふうなことがアリ、この作業が地道な作業で職人的な仕事になるそうです。
久保田臨さんはここをショートカットする特許を13個持たれており、Googleでは3つに対して考えると個人でこれを持っているということはすごいことですよね。
久保田臨さんは自分が美しいと思うものをプログラムで組んで使っておられるようです。
画像の作り方なんですが、プロンプトエンジニアリングというのとイメージトゥイメージという2種類のものがあるようです。
我々がよく使うのが文字入力して画像を生成するというふうなものをプロンプトエンジニアリングというそうです。
イメージトゥイメージは初期ファイルとして最初の画像をアップしてそれに対して重みづけをしていくというふうな流れになるようです。
これをすることで画像を生成するようなイメージです。
これ以降いろいろまだまだ話があるんですが、今日はここまでとしておきます。
ここまで聞いていただいた方ありがとうございます。
06:02
それではまた明日。さよなら。
06:11

コメント

スクロール