DALL·E、Stable Diffusion、Midjourneyの3つの画像生成AIを使ってみたので、わたしなりの感想を話しました。今のところ一番簡単に画像を元にした生成もできるDALL·Eが気に入っています。
=== 目次 ===
今話題の3つの画像生成AI
それぞれの無料枠とかかる金額について
わたしが気に入ってるのはDALL·E
Midjourney以外の二つはリアルな写真を作れる
どのAIも人間の顔を作るのは得意じゃない印象
-------
#アシカガCAST
デジタル活用のヒントをスキマ時間で。
話題のサービス、注目のソフトウェアの紹介、デジタルツールの活用術など、テック系情報をわかりやすくお届けします。
月〜水 朝8時に更新
■Twitterアカウント
https://twitter.com/ashikagacast
Apple Podcast、Spotify、Google Podcastなどでも配信しています。
■アシカガCAST on アシカガノオト
http://bit.ly/ashikagacast_notion
■アシカガノオト
http://bit.ly/ashikaganote
00:01
また、AI画像生成の話です。
ちょっと前に、ミッドジャーニーというAIによる画像生成の話をしましたが、
他にも、そういうAIはいくつかあって、今、同時に3つの画像生成AIが注目されている状態です。
その中の1つが、ミッドジャーニーなんですが、他にダーリーというのと、ステイブルディフュージョンというのがあります。
特に今話題になっているのは、ステイブルディフュージョンです。
先日、オープンソースでの提供が始まったんですね。
アプリケーションのように、簡単にインストールして、すぐ使い始められるという提供のされ方ではないんですが、
自分のパソコンに画像生成のAIをインストールして、
自分のパソコン上で好きなだけ画像をAIで生成させることができるようになったということで非常に盛り上がっています。
画像生成にはそれなりに時間はかかるようですが、
完全無料で誰もが個人でも自分のパソコンで画像生成AIを動かすことができるというすごい時代になったんですね。
私もMacBook Proにインストールしようとしたんですが、うまくいかず一旦断念しています。
多分そのうちもっと簡単に使えるように誰かが作ってくれたツールが出回ったりすると思います。
ステーブルディフュージョンの画像生成AIを使ったPhotoshopのプラグインやFigmaのプラグインも開発しているところがあって、
今後そういうのがどんどん出てくると思います。
また、Dream Studioというオンラインでステーブルディフュージョンを使えるツールもあります。
これはウェブブラウザから利用できて、ユーザーインターフェースもちゃんとしていて、ユーザー登録は必要なんですが、誰でも簡単に利用できると思います。
無料で利用できるのは200枚までという制限があります。
ただこの200枚というのは一番小さい画像サイズでステップ数が50という設定で生成した場合の枚数です。
03:03
なので画像のサイズをもっと大きくしたりステップ数という計算させる回数だと思うんですが、その数字を上げていくと生成できる枚数は減っていくということです。
ちなみに私は先日この無料で使える枠を使い切ってしまいました。
次にダーリーですが、こちらもウェブブラウザ上で使えるようになっています。
オープンAIというイーロンマスクなどが作った非営利団体が開発しています。
ダーリーは必ず同時に4つ画像を生成するんですが、無料枠ではそれを多分50回生成させることができます。
多分と言ったのは私が数えてみて50回だったからです。
こちらも私は無料枠を全部使い切って1回課金しています。
15ドルで115クレジット購入できるようになっています。
これは単純に115回生成できると考えていいと思います。
ステイブルディフュージョンをオンラインで使えるドリームスタジオの金額の話をしてなかったですが、
ドリームスタジオは10ポンドで画像約1000枚分ということです。
先ほど話した通り画像サイズやステップ数で生成できる枚数が変わってきます。
そしてミッドジャーニーを使うための金額ですが、
こちらはサブスクリプション制で月額10ドルのベーシックと月額30ドルのスタンダードがあります。
ベーシックでは月200枚まででスタンダードは枚数制限なしということです。
ミッドジャーニーが無料で使えるのは25回までらしいですが、私はミッドジャーニーはまだ無料で使えています。
この3つを使ってみて私が一番気に入ってるのはダーリーです。
というのもダーリーは自分がアップロードした画像をもとにバリエーションを作ってくれたり、
画像の一部を言葉で指示して別なものに置き換えることもできるからです。
06:02
多分本来の機能的には今回紹介している3つの画像生成AIは、
言葉から画像を生成するだけでなく画像からアレンジしたりできるはずなんですが、
今のところ私がwebブラウザからツールとして使っている範囲ではその辺がちゃんとできるのがダーリーだけということになります。
写真をもとにバリエーションを作る機能は画像をアップしてバリエーションを作ると指示するだけで自動で3つ画像を作ってくれます。
言葉で作るときは4つなんですが、画像から作るときは元画像を作った画像が並んで表示されるので、
元画像の分を1個引いた3つ生成されるようになっています。
画像の一部を変えるというのは、画像をアップロードした後変更したいところを消しゴムツールみたいな感じのもので消して、
その後言葉でどういうものにするかを書いて実行するんですね。
ただフェイク画像的なものを作られないように人物の顔写真はアップロードできないようになっているようです。
アニメや漫画のような絵柄のものであったり3Dグラフィックで作られたような人物はアップロードできるみたいですね。
アニメのような絵柄の顔のイラストだけをアップして体を描かせるという実験をやっている人の記事を見たんですが、
なかなかいい感じに体ができていました。
ダーリー上でいらないところを消すときにそんなに細かいところをきれいに消せないので、
あらかじめフォトショップなどの画像加工のアプリを使って、いらないところを背景を透明にしたPNGのファイルにしてダーリーにアップロードすると、
ちゃんと透過している透明の部分を認識してくれました。
ミッドジャーニーは独特の絵画っぽいアートっぽい画像を作るのが得意なんですが、
ダーリーは自然な写真っぽい画像も作ることができます。
これはステーブルディフュージョンも同じですね。
09:00
その分フェイク画像みたいなものに使われないかとか、
著作権侵害につながりそうな画像ができてしまうとか、
そういう注意しないといけない点も多そうなんですね。
私としてはダーリーの方がステーブルディフュージョンよりも処理も早いし、
作ってくれる画像のクオリティも高いように感じていたんですが、
調べてみるとステーブルディフュージョンの方が処理速度は早いしクオリティも高いらしいですね。
ドリームスタジオで低い解像度で画像を生成させて、
ステーブルディフュージョンの本来の実力を体験できてなかったということかもしれません。
あと、どのAIにも共通していると思うんですが、
人間の顔を作るのはあまり得意ではない印象です。
人の顔として破綻のないような画像を作るという発想をAIは持ってないと思うんで、
左右の目をちゃんと揃えようとかしてない感じなんですね。
人の顔として成立してない怖い画像を作りがちです。
まあそういう問題もどんどんクリアされていくでしょうし、
人の顔を作るのに特化したAIもあったりします。
今回は以上です。
10:38
コメント
スクロール