第673回 AIで画像生成 Bing Image Creator/Stable Diffusion Web UI (2023/3/26)

00:01

スピーカー 2

マイクロソフトの製品や技術を楽しく、分かりやすくお話しするポッドキャスト番組

ウッドストリームのデジタル生活です。

第673回目の配信になります。お届けしますのは木澤です。よろしくお願いします。

スピーカー 1

はい、今週もお聞きいただきありがとうございます。

この配信はクラウドファンディングキャンファイのコミュニティにより皆様のご支援をいただいて配信しております。

スピーカー 2

今回もやさりさん、ホワイトカラーさんはじめ合計10名の方にご支援をいただいております。

スピーカー 1

ありがとうございます。

ご支援の内容に関しましては、この番組ウェブサイト

スピーカー 2

windows-podcast.comでご案内しております。

もしご協力いただけるでしたらよろしくお願いします。

スピーカー 1

また、リスナーの皆さんとのコミュニケーションの場として

スピーカー 2

チャットサイトDiscordにサーバーを開設しております。

こちらはポッドキャスト番組、電気アワーカーと共同運用しております。

よかったら参加してみてください。

スピーカー 1

DiscordサーバーのURLは番組ウェブサイトにリンクがあっております。

スピーカー 2

また、この配信はApple Podcasts、Google Podcasts、Spotify、

Audible、Amazon Musicで聞くことができます。

スピーカー 1

はい、ということで、昨日3月25日ですね、

スピーカー 2

ドットネットロボ勉強会でSurface Pro 9のお話をさせていただきました。

スピーカー 1

Surface Pro 9ね、日本マイクロソフトさんから評価機として製品をお借りしていまして、

スピーカー 2

こちらについてね、実機レポートの第1弾ということでですね、

お話をさせていただきました。

スピーカー 1

なかなかこれ、ポッドキャストでしゃべるのは難しいなってくらいの実機を見せて、

あと実際ビデオで録画してですね、それを再生しながら

スピーカー 2

PowerPointで説明をするというようなものを用意したんですが、

そういった話をさせていただきました。

早速ですね、皆さん見ていただきたいなということで、

スピーカー 1

YouTubeのほうで、私のチャンネルでですね、

スピーカー 2

この30分間のSurface Pro 9の実機レポートということで動画も配信しておりますので、

スピーカー 1

この番組のリンクのほうにも貼っておきますし、

Twitterのハッシュタグシャープウッドストリームのデジタル生活のほうでもご案内しますし、

あとはDiscordのほうでもね、ご案内していますので、

スピーカー 2

そちらでね、ちょっと見ていただければなと思っております。

もちろんポッドキャストの番組の中でもですね、お話をする予定ですので、よろしくお願いします。

スピーカー 1

さて、今回のお話ですね、最近なんかやたら続いているAI話ですね。

スピーカー 2

これもね、あの話をまたしたいと思っております。

というのがですね、最近やっぱりこの類のニュースがどんどんどんどん入り込んできて、

本当日々アップデートしていくんですよね。

ですから、もうついていくのが楽しいなという、大変だろうじゃなくて楽しいなという状況でして、

スピーカー 1

ここら辺の機能というのは、そしたらWindowsとかにも降りてくるとね、いいなと思っているんですが、

基本的にクラウドでやっているという感じです。

03:00

スピーカー 1

今回お話しするのがですね、マイクロソフトのビングのビングイメージクリエイター、

これについてお話をします。

マイクロソフトのビングは、もう新しいビングということでね、

チャットGPTとかに使われているGPT、オープンAIのGPT4になりましたけど、

スピーカー 2

4を利用したほとんど会話ができるようなね、チャットのシステムができていますけども、

ビングはですね、さらにビングイメージクリエイターということで、

スピーカー 1

これはですね、言葉から画像を生成するというものなんですね。

これすでに発表はあったんですけども、

ビングで使えるようになったというのが、つい先日ですね、3月の21日だったかな、

本当につい先日に使えるようになったというものになります。

これ実際使える人は、新しいビングの先行利用に登録して参加している方のみになりますが、

一般リリースというのはちょっとまだ先になりますけども、先行リリースということでやっています。

このビングの新しいビングを試している方が何万人規模でいると思いまして、

スピーカー 2

私の周りもほとんど結構皆さん使っていますので、

スピーカー 1

ウェイティングリストの方ね、申し込んで数日ぐらいで、

スピーカー 2

早い人は1日ぐらいで使えるようになるということで回答がありますので、

ぜひ使っていただければなと思っております。

スピーカー 1

さてこのビングのイメージクリエイター、これはですね、先ほど言いましたように言葉を書いて画像を返してくれる。

スピーカー 2

ちょっと今日この後もお話ししましたので、ステビルディフュージョンみたいな形で書いた言葉で画像を作り出してくれるというものなんですね。

早速私も試してみました。

URLがですね、bing.comのスラッシュイメージズスラッシュクリエイト、

スピーカー 1

イメージズはIMAGES、クリエイトはCREATEですね。

スピーカー 2

bing.comスラッシュイメージズスラッシュクリエイト、

スピーカー 1

こちらのサイトにアクセスしていただくと、

ビングで作った絵がこういうものができますよというのと、

スピーカー 2

画面の一番上にテキストを書き込むテキストボックスがありますので、

そちらで使っていただくということになります。

スピーカー 1

実際入れてみました。

それでですね、これは入れてみたんですけど、

まず重要なのが、今のところ書ける言葉が英語のみです。

スピーカー 2

言語は英語のみです。

スピーカー 1

日本語はおいおいできていくと思うんですけども、

スピーカー 2

英語でキーワードをカンマ区切りで入れていくという感じです。

スピーカー 1

本当ステビルディフュージョンと同じような感じですね。

スピーカー 2

プロンプトを入れていくというものになります。

英語で入れて作成というボタンを押すと、

一つの話題に対して4つ画像を作ってくれます。

スピーカー 1

この4つの画像をまとめて出してくれるんですが、

この生成時間がだいたい10秒くらいですね。

スピーカー 2

10秒くらいで画像を4枚生成してくれます。

スピーカー 1

結構ちゃんとしたというか、解像度の高い画像を出してくれるんですね。

06:04

スピーカー 1

この4つの画像の1つあたりの画像の解像度ですね、

スピーカー 2

1024x1024ピクセル、この解像度で画像を出力してくれます。

スピーカー 1

今のところまだ制限事項がありまして、

1日25セットまで、つまり1回キーワードを叩いて4つの画像をもらえるというのが

スピーカー 2

1日25回までというふうに制限が入っています。

ということで私ちょっと今日遊んじゃったので、残り20回くらいあるんですけれども、

そういったところで画像を生成してくれます。

この画像生成というのはどういう仕組みを使っているかというと、

スピーカー 1

これもやっぱりオープンAIですね。

スピーカー 2

オープンAIというのはAIを研究する企業でして、

マイクロソフトがこの企業に対して数十億ドルの投資をするというふうに

査定屋のやたらが言っていて、投資して応援している企業になります。

スピーカー 1

そのオープンAIの画像生成用AIモデル、これDALYっていうんですね。

DALYというものの直記バージョンを採用しています。

スピーカー 2

おそらくDALY2というやつだと思うんですが、

これを採用して画像生成をしてくれています。

スピーカー 1

これ先々ですね、エッジの新しいバージョンは

右上の方にBのビングのボタンがあります。

今これBのボタンを押して、新しいビングの利用されている方は

スピーカー 2

このままチャットができたり、文章の生成ができたり、

スピーカー 1

あと分析ができたりとかね、そういったウィンドウが

スピーカー 2

右側に縦に出てくるんですけども、

スピーカー 1

そこに言葉を入れると画像も生成してくれるというのも

スピーカー 2

先々できるようになるらしいです。

スピーカー 1

できるよって話もありますし、

ただちょっと私やってみたらダメでしたね。

スピーカー 2

なんかチャットのところで回答のトーンを調整するというところで

その他独創性、その他バランス、その他厳密という

3つ選ぶことができるんですけども、

スピーカー 1

その他独創性って選んでキーワードを入れると

スピーカー 2

画像も生成してくれるよというのが先々実装されるようです。

ちょっと試したんですけど、私のところではまだ使えませんでした。

スピーカー 1

そして実際使ってみました。

スピーカー 2

結果としてはかなり雰囲気のいい画像を作ってくれます。

今3パターン私試したんですけど、

港の街の夜景、night,city,baysideというキーワードを入れて

スピーカー 1

画像を作ってみました。

と言っても、ポッドキャスターで画像をお見せすることはできないんですが、

港未来なんだか東京なんだかというどこかという微妙な夜景で

スピーカー 2

港街で不当があって、それぞれ街があって

夜なので夜景がきれいに見えるというような

そういった画像を作り出してくれています。

スピーカー 1

やっぱり本当にCGなんですけども、

09:00

スピーカー 2

これなんかイラストとして使えるなというぐらいの

クオリティの高いものが出てきています。

街の明かりが港の海のところに光に反射してリフレクションしてくるところとかですね。

空もいい感じに夜の雲とちょっと濃い青が重なってというところで、

さらに街の明かりもうまく反射してという感じがあって

すごく感じのいい絵が出来上がっています。

スピーカー 1

もう一つが桜ですね。

スピーカー 2

今のシーズン、桜は咲いているんですけど雨が降ってちょっと残念なことになっちゃっているんですが、

これはシティ、カンマ、チェリーブラッサム、ツリーズ。

シティとチェリーブラッサム、ツリーズという桜並木という言い方で作りました。

そうすると出来上がった画像が青空と東京の街っぽい、

隅田川とかそこら辺かな、というところに桜がですね、

満開のピンク色の綺麗な桜が並んでいるというようなものになります。

横断歩道があってビルがあってその手前に桜並木がある、人が歩いているとかね、

日本の風景ですよね。見た感じ外国じゃないなという感じがします。

玉川の河川敷っぽい絵とかね、そういうのが4つ出てきていまして、

そこで桜の描写も細かく花びらがありますよという感じの綺麗な描写が出ています。

すごいですね、よく見ると川にも散った桜が浮かんでいたりとかですね、そんなものがあって、

ものすごくリアルな、これはリアルですね。

スピーカー 1

よく見るとCGなんですけども、これリアルだし、

例えばブログの記事に貼り付けるだとか、

スピーカー 2

あといろんなプレゼンシールに貼り付けるとかいうのでもいいですし、

そういったのも使える、本当に十分な絵になっています。

それともう一つ、私の大好きな夜景ですね。

さっきも港町の夜景をやったんですけども、

普通にナイトビュー、カンマ、ダウンタウンという街の夜景というのを作ってみました。

これも東京っぽいところなんですけども、

ビルがあって街があって小交差点があってですね、

この光もですね、広築というか光が広がるような、

例えばカメラでF値を高くしたような時に撮影したような画像がですね、

そういったのが出てきています。

スピーカー 1

あとは、これ車が走っているんだけど、

道路と街灯の光とか、あと走っている車がですね、

12:00

スピーカー 1

これ走っている車自体のですね、光の軸が見えているんですね。

スピーカー 2

カメラで撮るとよくそういう撮り方ができるんですけども、

車が走ったライトが流れる線のようにつながって見えているというかね、

そんな風な描写もあります。

スピーカー 1

だから本当に細かい描写もあるし、

スピーカー 2

街の一部なんだけど、遠くのほうの細かい街の街明かりというのも再現できていて、

スピーカー 1

これ本当にポッドキャストでは伝えづらいんですけども、そんな画像を作ってくれました。

この類のやつはいいですね。

いろんなところで使えないかなと思いますし、

あとどうだろう、これパソコンの絵とか作り出せるなら、

スピーカー 2

ちょっと私の電子書籍のところに入れてみたりとかね、

そんな風にしてみたいと思っています。

どうなるのね、PC80001とか書いたらPC80001書いてくれるんですかね。

スピーカー 1

さすがにそれやってくれそうもないんですけども、

スピーカー 2

レトロなパソコンって私の電子書籍に差し絵とかでもいいですし、

スピーカー 1

差し絵だとあれか、現実的じゃないか、

スピーカー 2

あと表紙に書いてみるっていうのもいいかなと思っています。

1日25セットまでなんでね、

とりあえずちょっと遊ぶにはいいかなっていう感じなんで、

これからも使ってみたいと思っています。

それとあともう1つ注意事項なんですが、

スピーカー 1

例えば、いわゆるよろしくない絵ですね、

スピーカー 2

公衆なんとか上、よくない絵だとか、

あと普通に女の子の絵を書いてくださいはダメです。

スピーカー 1

そういったのを1回私貼り付けてみたんですね。

スピーカー 2

ステビルディフィージョンでやっているプロンプトを

スピーカー 1

ほぼそのままビングイメージクリエイターに貼り付けたら、

問題が発生しましたというような、

多分問題が発生したっていうのは、

スピーカー 2

こういった絵は生成できませんよという意味だと思うんですが、

そういったメッセージが出てきて生成することはできないです。

そこはやっぱりマイクロソフトはきちんとやっていくんじゃないかなと思っています。

今画面ショット見つけましたね。

画像の作成中に問題が発生しました、

というロボットがひっくり返った絵が出てるという感じになっています。

スピーカー 1

もちろんマイクロソフトのビングイメージクリエイターだけじゃなく、

スピーカー 2

アドビもフォトショップにこういった機能を組み込むだとか、

そういったことをどんどんやっていますので、

スピーカー 1

まさにこういった画像生成系というのも

スピーカー 2

広がっていくんじゃないかなというふうには思っています。

まずなかなかいい品質の画像を作り出してくれますので、

しかも4枚生成して10秒間で作ってくれるという、

この速さもありますので、

スピーカー 1

今後私も使ってみていろんなところに利用できるかなと思っています。

スピーカー 2

以上、AIで画像生成、マイクロソフトのビングイメージクリエイターの話をさせていただきました。

15:06

スピーカー 1

もう一つ、これはマイクロソフトのネタではないのですが、

画像生成のもう一つ、やはり有名どころのステーブルディフュージョン、

スピーカー 2

これについてもちょっとだけお話をさせてもらいたいと思います。

スピーカー 1

ステーブルディフュージョンについては、去年の後半だったかな、

スピーカー 2

こういうのができますよというところで、

スピーカー 1

当時はステーブルディフュージョンの、

とりあえず画像生成してくれるというところで、

スピーカー 2

ステーブルディフュージョンGリスクGUIというものを使って、

言葉を入れるとちっこい画像が作ってくれますよという紹介をさせてもらいました。

これWindowsで使えますよという話をさせてもらったのですが、

スピーカー 1

今度はその時から出ていたのですが、ステーブルディフュージョンWebUIという、

これもステーブルディフュージョンを使った画像生成してくれるソフト、

それをステーブルディフュージョンを活用するためのフロントエンド的な、

スピーカー 2

フロントエンドのかつ、実際処理そのものもローカルのパソコンの中で行ってくれるというものになります。

これですね、私持っているグラフィックボードが、

NVIDIAのGeForce GTX1050Tiなんですね。

しかもメモリーが、VRAMが4GBというもので、

スピーカー 1

もうこれ使えないだろうと思っていたんですね。

先ほど話したステーブルディフュージョンGリスクGUIで、

4GBで本当に小さい画像しか作れなくて、

スピーカー 2

ちょっと大きい画像にしようとすると、

メモリオーバーで使えませんと出てきたんですね。

スピーカー 1

それが確か512x512が作れなかったのかな。

スピーカー 2

そんなところがあったんで、諦めてたんですよ。

スピーカー 1

諦めてたんですけども、

スピーカー 2

Googleのコラボを使って、ステーブルディフュージョンを使ってですね、

スピーカー 1

いろいろ画像生成してたっていうのをやってたんですけども、

実際Googleのほうであまり使いすぎてですね、

もうGPU、今月はもう使えませんよっていう上限に達してしまったっていうのがあって、

また来月ということになったんで、

ダメ元でステーブルディフュージョンのWebUIって入れてみるかなと。

スピーカー 2

もちろんGoogleのコラボにステーブルディフュージョンを入れて使うっていう方法もあって、

スピーカー 1

月額で1170円くらいだったかな。

スピーカー 2

払えばGPUを結構使わせてくれるってことになるんで、

スピーカー 1

月額で払ってもいいかなと思ったんですけど、

一回ちょっと試しに手元でやってみたいなっていうのと、

あとはWebのGoogleコラボでやった、

Googleのクラウドの中でもステーブルディフュージョンを動かしてくれるんですね。

それでやると、どうも私もまだ使い方がわからないんだけど、

スピーカー 2

一つのモデル、チェックポイントって言ってるんですけど、しか使えないっていう。

18:07

スピーカー 2

もしかしたらやり方あると思うんですけどね。

そういった記事を見たことあるんで、やればいいかなと思ったんですけども、

ちょっと手元で手軽にやってみたいなっていうのもあって、

インストールをしてみました。

そうしたらですね、なんとGeForce GTX1050Ti、メモリ4GBでもちゃんと使えました。

スピーカー 1

いろんなまとめサイトがあって、それ参考にインストールしたんですが、

スピーカー 2

私もちょっと再インストール、再度同じそれを見て再インストールしたんですけども、

やっぱりちょっとバージョンが上がってるだとか、書いてる内容とメニューの書き方が違ってるっていう、

スピーカー 1

実際やってるとバージョンが上がってくるっていうこともあるんですけどね。

そういったところがあるんで、ちょっと自分なりに整理する意味で、

スピーカー 2

私のブログの方にも改めて書き起こしました。

タイトルが、ステイビルディフュージョンでとりあえず女の子の絵を生成したい方への超ざっくり手順章というタイトルで、

高尾三大プログラマーというブログの方で書いております。

スピーカー 1

これは他の方がやったことをやりましたってことなんですけど、私なりに整理をして、

このブログの記事としては、脳書きいいからと、前提の知識いいからとりあえず言ったようにやって、

スピーカー 2

絵を作るところまでまず持っていきましょうと、そこから改めてみんなで勉強しましょうよというような形の目的で記事を書いています。

実際にこれを書いた記事で、電気ウォーカーのコーヒーさんもこれどおりやっていただいてうまくいったということで、

リスナーさんの方も何人かこれどおりやってみましたという方で、いろいろ絵を作られていますけど、

スピーカー 1

そんな感じでできるだけわかりやすく、書いた通りにやればいいよという記事を書きましたので、

やってみたい方はぜひ見ていただきたいなと思っております。

ここで実際に私もやったのが、ざっくり言うと、いろんなソフトをインストールしていかなきゃいけないんですね。

どこかのインストーラーをダウンロードして、Exeを叩いて、はい、できましたという状況ではなくて、

それはちょっとまだ式の高さにはなっているんですけど、ざっくり言うと、まずPythonという言語、

とても私も仕事でも使っていますけど、なかなかお手柔らかな言語なんですけど、Pythonをインストールします。

Pythonのバージョンが3.11.2が最新だと思うんですけど、これ最新版を入れるとまだ対応していない、

スピーカー 2

動作保証していませんよというワーニングが出てきて、こうなるとインストールができなくなってしまうというのがありまして、

スピーカー 1

エラーでインストールが止まっちゃうんですね。

ここは動作保証を確認されているPython3.10.6というのを狙い打ちでダウンロードします。

21:02

スピーカー 1

このダウンロードするのもちゃんとリンクも貼ってあります。

スピーカー 2

あとはStable Diffusionをダウンロードしてくるのに、GitHubにStable Diffusionが置いてあるので、

スピーカー 1

Gitのインストールもしてもらって、入れている方は改めてインストールする必要はないと思いますが、

スピーカー 2

入れていない方は改めてインストールしていただくと。

あと、このStable Diffusionを動かすためには、NVIDIAのGeForceのグラフィックボードが必要なんですね。

しかもそのCUDAというものを使えるようなものではないといけないというものになります。

スピーカー 1

実際、NVIDIAのサイトからCUDAというのをダウンロードしてインストールします。

このCUDAの容量がでかいんですね。2.7GBあるんですけど、これをダウンロードしてインストールします。

スピーカー 2

これはExeをダウンロードしてきて実行して、ウィザードに従って言った通りにインストールというものになります。

ここで一回OSを再起動した後に、いよいよStable Diffusionをインストールということで、

Gitの機能を使ってコマンドラインで打ち込みます。

そうすると、ザーッと文字が流れていってダウンロードしてくれます。

スピーカー 1

これだけで基本OKなんですね。

スピーカー 2

ただ、この後重要なのが学習モデルをダウンロードしなければいけないんですね。

どんな絵を作ってくれますかというモデルがあります。

スピーカー 1

これ、Stable Diffusionではチェックポイントと呼んでいるんですけども、これをダウンロードします。

スピーカー 2

基本的なものをダウンロードするのもあるし、

例えば実写系の女の子の絵を描いてくれるモデルだとか、

イラスト系の女の子の絵を描いてくれるモデルだとかというのがものすごくたくさん出ています。

これは皆さんお好みで、いろんな方いろんなものを試してみているんですが、

これは私のブログの記事では、実写系の女の子とイラスト系の女の子を描いてくれるモデルのリンク先を貼っています。

それぞれ何GBという量なんですけども、それをダウンロードしてきて、

あとはバッチファイルを起動します。

スピーカー 1

これは基本的にウェブアプリケーションになっているんですね。

スピーカー 2

自分自身のパソコンの中にウェブサーバーみたいなのを立ち上げて、それを実行するということになっています。

まずバッチファイルを起動すると、DOS窓、コマンドプロンプトが立ち上がって実行します。

そうすると、自分自身のウェブサーバーにアクセスするというURLが出てきます。

私の場合は、実行しただけでブラウザが立ち上がって、自動的にこのページを開いてくれます。

そうすると、やっとStable DiffusionのWeb UIというアプリケーションの画面が出てくると、これでやっと使えるということになります。

これはあまり細かい話は画面を見ながらしないといけないと思いますので、これ以上詳しくは言いませんけども、

スピーカー 1

ここにどういったキーワードを入れるか、例えばこんな女の子を描いてくださいとか、こんな夜景を描いてくださいというのを入れる欄と、

24:03

スピーカー 1

あとNGワードですね、例えば卑猥な画像を出さないでくださいだとか、低品質の画像を出さないでください、モノクロはやめてくださいというネガティブプロンプトという、

これプロンプト、書いてもらいたい言葉を書くプロンプトとネガティブプロンプトというのがあって、

スピーカー 2

その下にネガティブプロンプトというのをセットで書いて、あとはいろんなパラメーターですね、サンプリングメソッドだとか、

どのチェックポイント、どのモデルを使うかというのを選んで、ジェネレーターとボタンを押すと絵を作ってくれるということになります。

ということで、一回インストールしてこのWeb UIというもので立ち上げてしまったら、あとはいろんなものを入れてみて楽しんでいただくということになります。

ここに来るまでが結構大変だというのがあるので、セット名で私のブログの記事を書いたんですが、結構ここまで入れれば楽しめるというものになります。

私のところで、私のビデオカード1050Tiで一つの画像、だいたいポートレートっぽいものを作るのに横512ピクセル、縦768ピクセルというものを作っています。

スピーカー 1

もっといいビデオカードを持ちの方は高い解像度で作っているのですが、これ以上やるとメモリー4ギガだと足りないです。

スピーカー 2

もうアウトオブメモリーとエラーが止まってしまいます。

スピーカー 1

でも1050Tiのメモリー4ギガでこのぐらいの容量で、このぐらいのサイズの絵を作ってくれますのですごくいいと思うんですね。

作る時間なんですけれども、私の場合は一つの画像を作るのに3分30秒です。そのぐらいかかります。

スピーカー 2

だから10枚出すのに34分かかるという感じで、一枚一枚作って試してということをやっています。

3分30秒かかるのかというのがあるんですけれども、これがいいビデオカードを使うとどうなるかというと、

スピーカー 1

電気アウォーカーのコーヒーさんが、これ2070だっけ2060だっけを使うと、なんと10秒です。

スピーカー 2

10秒で作ってくれます。

スピーカー 1

シンゴさんって、グルドンでも皆さんおなじみの方で、カメラ3人間で電気アウォーカーでも一緒にお話しています。

スピーカー 2

シンゴさんを3060をお持ちなんですけれども、もう10秒かかんないぐらいみたいですね。

すごい、ビデオカードによって私のところより20倍以上のスピードで画像を作ってくれますので、

これは新しいビデオカードが欲しいなというふうに今思っています。

やっぱりここのところで1つパラメータ入れて画像を試してというのを出すのに、

3分半待つのと10秒ぐらいでパッと出してくれるというのはさすがに違うんですね。

だいたいこういったパソコン関係の投資、倍スピードが違うぐらいだったら本当に必要かなということを考えちゃうんですけど、

27:06

スピーカー 1

さすがに20倍速いとね、これ考えちゃいますよね。

スピーカー 2

ということで、今私、ビデオカードを買うかなと。

パソコン本体買えるかって話もあるし、サービスも欲しいし、カメラも欲しいしというのはいろいろ欲しいのもあるんですけど、

なんか今一番お金投資していろいろ遊べるのがビデオカードかなというところで、

GeForce RTX 3060のメモリー12GBのモデルが48,000円ぐらいかな、

スピーカー 1

ドスプラで売っているので、なんとかこれを買えないかなというふうにちょっと言答しているところです。

スピーカー 2

そんなところでね、いいハードを使うとやっぱり効果も違うなというのが特に現れてきました。

スピーカー 1

ですから、本当にビデオカード必要なの?

スピーカー 2

例えばフルHDであれば、エースコンバットもマイクロソフトフライトシミュレーターも遊べるし、

まあいいかなというふうに思っていたんですけども、

いやさすがにこれはパソコンとして世間に追いついていないぞという感じがすごくしてきたので、

ビデオカード増強をしたいなと今考えているところです。

そういったところでね、手元でステビリディフュージョンで絵をどんどん描けるというところでね、

すごく楽しめるところもありますので、

だいたいNVIDIAで、私が言っている1050以上の方、お持ちの方はとりあえず使えますので、

よかったら私のブログの記事を見てインストールしていただければなと思っております。

実際どんなプロンプト、いわゆる呪文と言われているんですけども、

を入れればいろんな絵が描けるかというと、

またこれがほとんど一つのジャンルと言っていいくらいあります。

例えば、髪の毛は黒にしてくれたとか、

目玉は大きくして黒にしてくれとか、

青い瞳にしてくれとか、

髪の毛が金髪にしてくれとかね、

いろいろとキーワードを入れたりとか、

ちょっとこの番組では言えませんけど、

いろんなキーワードを入れるとこんな風に作ってくれますというのをやってくれます。

そこは非常に情報交換、どこで情報交換すればいいのというところもあるんですが、

スピーカー 1

ステビリディフィジョンで検索してくれれば、

スピーカー 2

こういったどういったプロンプト、いわゆる呪文を使えばいいですかというサイトはすごくたくさんありますし、

スピーカー 1

何よりも、ディスコードのウッドストリームデジタル生活と電気屋ウォーカーの共同コミュニティ、

スピーカー 2

冒頭でもお知らせしている共同コミュニティに

ステビリディフィジョンの部屋というのを作りました。

今、これね、これポッドキャスト番組のコミュニティのはずなんだけど、

ここが今一番盛り上がっています。

ものすごいペースで情報が書かれていまして、

30:01

スピーカー 2

はじめ一つの部屋を作って、私が適当に書いていたんですけど、

ここがさすがのコーヒーさんがきちんとカテゴリー分けして部屋を作り直してくれて、

情報の部屋とかノウハウの部屋とか、お試しで作った絵を貼り付けるところとか、

そういったのを用意して、みんなで今情報交換しています。

ものすごいペースで書かれていますので、

これね、私もこの部屋を作った私が追いついていないっていうくらいなんですけども、

スピーカー 1

すごく例えばこんなプロンプトを入れればいいよとか、

スピーカー 2

あといろんなエクステンションがありますので、例えば入れるといいとかね、

私よく使ったのが、一回実行しておけばほっとけばどんどんどんどん絵を作ってくれるっていう、

放置系のものを作るとかね、そういったのもやり方を教えてもらったりとか、

あと自分自身で画像を貼り付けて、こんなプロンプトでやりましたっていうのをやって、

じゃあこのプロンプトをちょっと書いてみて、私も作ってみましたとかね、

スピーカー 1

あとこういった背景の絵を作りたいんだけどどうやらいいんだろうというと、

スピーカー 2

じゃあこんなキーワードを入れたらとか、こんなエクステンションを入れてみたらとか、

いろんな情報が今飛び交っていますので、ぜひね、興味のある方はですね、

Discordのほうに入っていただいて、Stay With Diffusionのところに来ていただくと、

しんご先生、コーヒー先生、たいじ先生がですね、本当にたくさんいろいろ情報を書いていただいていますし、

スピーカー 1

あと、そうですね、リスナーの皆さんもすごくいいセンスをした方がおられますので、

スピーカー 2

素敵な絵を描いているなという方もいますのでね、

ぜひ興味のある方はこちらのDiscordのお部屋に来ていただければなと思っております。

はい、そういうことでね、Stay With Diffusionについてお話をさせていただきました。

スピーカー 1

えーと、なんか最初のビング類の話、長々とおしゃべっちゃった気がするんですけど、

スピーカー 2

こんなことでね、AIの画像生成というのもいろいろ楽しんでいきたいと思っていますので、

ぜひね、こういったところ、これもやっていきたいと思っております。

はい、以上ですね、Stay With Diffusionのお話をさせていただきました。

はい、第673回はAIで画像生成、ビングイメージクリエイターとStay With Diffusionを動かしてみたという話をさせていただきました。

なんかね、楽しいですね、こうやって作り出す、ものを作り出すっていうかね、楽しいし。

あとね、一つだけ、これハンケン絡みの話、非常に気になると思います。

スピーカー 1

これハンケンはですね、一応アメリカの方では、AIで作った画像はハンケンはないと、

スピーカー 2

誰かにハンケン帰属するもんじゃないよっていうふうに言われてるんですけども、

やっぱり気になるのはこのモデルチェックポイントですね、Stay With Diffusionの場合は。

スピーカー 1

この方がやっぱり元を作ってるんで、やっぱり同じような顔の女の子が、

女の子ばっかり作ってるとかって言われそうなんですけど、画面が出てくるんで、

33:02

スピーカー 2

ちょっとハンケンあるのかなと思ってたんですけども、

このモデルを登録しているサイトの方に、これは商用利用して売ってもいいですよとか、

あとはこれを他と混ぜてモデルとして出すのはやめてくださいとかね、

スピーカー 1

明確に作者ごとに書いてますんで、そこを見ていただいて、

スピーカー 2

ちょっとそこに守っていただいて使っていただくといいかなと思っております。

私もこれすごく注意して見てますし。

スピーカー 1

新しくモデルチェックポイントをダウンロードしてくるときは、

スピーカー 2

どういうふうに使っていいのかなっていうのをよく見てやってますんで、

すごくそこら辺を注意していただきたいなと思っております。

ということで、もう3月はこれで最後の配信ということで、

次はいわゆる2023年度の配信ということになりますんで、

また4月からもですね、いろいろとマイクロソフトの製品や技術とか、

スピーカー 1

デジタルガジェットとか、今回みたいなちょっといろんなトレンドを拾ってきて

スピーカー 2

お話をしたいと思ってますんで、よろしくお願いします。

はい、そういうことでまたいろいろネタサービットを話したいと思います。

またよろしくお願いします。

スター

エピソードをシェアする

メッセージを送信

木澤朋和

木澤朋和

スター

コメント

こちらもおすすめ