#31 Black Forest Labsが発表した画像生成AI、FLUX.1をレビュー🎨

00:08

皆さんこんにちは、ロボシンクの矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者向けにAIを分かりやすく解説する番組です。

今回のテーマは、ブラックフォレストラボが発表した画像生成AI、FLUX1をレビュー、について話していきます。

はい、ということで今日は、ブラックフォレストラボが発表した画像生成AIのFLUX1について話していきたいと思います。

ちょっとですね、2日前ぐらいからでしょうか、冷房のあたり過ぎか、風邪かちょっとわからないんですけど、喉の調子が悪いんですよね。

ちょっと聞きづらいかもしれませんが、すいません、ご了承ください。

はい、では今日はですね、画像生成AIのFLUX1について話したいと思います。

皆さん、こちら画像生成AIのFLUX1使ってみましたでしょうか。

こちらですね、8月1日に発表されて、まだ認知度が低いサービスになると思います。

なので、初めて聞いたっていう人もいれば、ちょっと聞いたことはあるけど、まだ使ったことがないという人も多いと思います。

ただこのFLUX1ですね、かなり高品質な画像生成できるということで、海外でもじわじわユーザーを増やしているサービスになります。

今日はこのFLUX1と画像生成AI全体の話について掘り下げていきたいと思います。

今日話すポイントは主に3つです。

1点目に、そもそもFLUX1って何ですかという話ですね。

2点目に、FLUX1で実際に私が画像生成を試してみた感想ですね。

あとは使い方なんかも紹介していきます。

あと最後に3点目、ちょっとFLUX1から離れて、

ChatGPTの画像生成AIであるDARI3のアップデートについて話したいと思います。

実はですね、DARI3、有料ユーザーしか使えなかった機能でした。

でもですね、最近無料ユーザーにもこの機能は開放されたんですね。

そのことについても話していきたいと思います。

ではまずFLUX1について話したいと思います。

というかですね、台本を作っている時に気づいたことがあります。

実はこのポッドキャスト、画像生成AIの話題を取り上げるのってこれが初めてなんですよね。

普段はChatGPTのような会話型のAIというのをメインに話しています。

ChatGPTやクロード、ジェミニなんかですね。

それ以外に今まで動画や音楽のAIの話もしてきました。

でもですね、画像生成AIの話をするのっていうのはちょっと今回が初めてですね。

FLUX1について説明すると、ブラックフォレストラボという会社が8月1日に公開した画像生成AIですね。

なので今月の頭ですね、に発表されたばかりのサービスとなります。

03:01

このブラックフォレストラボという会社、聞き慣れない会社だと思います。

この会社ですね、ステイブルディフュージョンの開発者の人が創業した企業となります。

このステイブルディフュージョンというのは画像生成AIの有名なところですね。

ステイブルディフュージョンの開発者の方が立ち上げた会社がブラックフォレストラボ。

そしてブラックフォレストラボが公開した画像生成AIがFLUX1というわけですね。

このFLUX1は3つのモデルがあります。

プロ、デブ、シュネルの3つですね。

このモデルというのはChatGPTと同じで性能を左右するものですね。

例えばChatGPTであればGPT3.5やGPT4のようなモデルがあります。

FLUX1では3つのモデルがあって、プロが最上位モデルというわけですね。

ちなみにこのプロで商業利用もできるというものになります。

デブっていうのはDEVと書いてデブですね。開発者向けの非商用モデルです。

商用ができないモデルですね。非商用モデル。

そしてシュネル、3つ目のモデルですね。

シュネルは生成スピードの速いモデルで、ローカル開発や個人利用のために調整されているモデルとなります。

ちなみにこのシュネルっていうのは聞き慣れない単語だと思うんですけど、これはですねドイツ語らしいですね。

ドイツ語で速いというような意味になるそうです。

FLUX1の中でも軽量モデルのような立ち位置がシュネルというモデルですね。

プロ、デブ、シュネルの3つのモデルがあって、プロでは商用利用もできるというようなものになります。

そもそも何でFLUX1が注目されているのかという話になります。

これですね、簡単に言うと画像の品質が良いからですね。

もうですね、人物画像の品質っていうのがすごく高いですね。

今までこう人物画像といえばMIDJOURNEYが強かったです。

それに割って入る形でFLUX1がやってきたかなという印象があります。

あとはですね、このFLUX1、APIから利用できるんですね。

そのAPIから利用できる点というのもすごくいいと思いました。

APIというのはプログラミングからAIを操作できるものになります。

なので画像生成をする時に手動で生成するのではなくて、プログラミングのコードをかけばですね、自動化して画像生成をすることもできます。

こういったこともあってですね、海外でも注目されているサービスだと思います。

実際に私もですね、このFLUX1試してみました。

まずは人物ですね。

人物の品質っていうのはすごくいいですね。

かなり自然な画像が出てきます。

下手するとですね、AIと見分けがつかないぐらいのレベルの画像だと思います。

人物画像ですね。

06:00

人物画像以外にも風景画像なんかも試してみました。風景画像もいい感じですね。

その他にも動物とか、あとは空想上の生き物、ドラゴンとかですね、試してみました。

どれもかなり高品質ですね。

いろいろこう画像を試してみる中で若干弱いなと感じたのはイラスト系でしょうか。

決してイラストの品質が低いというわけではないです。

ただですね、ミッドジャーニーとかに比べるとイラストはちょっと弱いのかなという印象を受けました。

あくまで他と比較した場合ですね。単体で見た場合っていうのは全然品質は問題ないですね。

で、あとは画像の文字入れっていうのも強いみたいですね。

画像の中にテキストを入れる指示っていうのがあるんですけど、

結構他の画像生成AIってこれを苦手とするところも多いんですね。

ただ、フラックスワンはこういった画像への文字入れっていうのもうまく機能するように感じました。

海外でフラックスワンが注目されるようになったのは、

単体での画像ももちろん注目されるような高品質な画像なんですけど、

動画生成AIと組み合わせたクリエイティブで特に注目を集めています。

例えばフラックスワンと動画生成AIのクリングやランウェイ、

あとはこのポッドキャストでも以前紹介したドリームマシーンなんかですね。

こういった動画生成AIと画像生成AIのフラックスワンを組み合わせると、

そうするとかなり品質の高い動画が生成されるというわけですね。

特に人物画像なんかの品質がすごく高いので、

フラックスワンで人物画像を生成して、

その人物画像に動画生成AIで動きをつけるという、

こういった使い方が非常に注目を集めています。

フラックスワンの使い方っていうのは大きく分けて2つあります。

1つ目は自分のパソコンにインストールして使う方法ですね。

あのステイブルディフィジョンのような感じですね。

自分のパソコンにインストールして使うと。

で、もう1つはオンラインで用意された環境の中で使う方法ですね。

個人的にはオンラインで用意された環境で使うのが簡単かなと思います。

一番簡単にですね、このフラックスワンを試す方法は、

ハギングフェイスというサイトにアクセスすることです。

このサイトにアクセスをすればですね、

特に会員登録とかそういった操作は不要で、

プロンプトを入力するだけで画像生成を試すことができます。

もしこのポッドキャストを聞いているリスナーの方の中で、

GitHubのアカウントを持っている方、

こういった方はですね、

ReplicateやFAL AIというサイトでも試せます。

このGitHubっていうのはソフトウェア開発のプラットフォームですね。

よくエンジニアの方とかは、

GitHubのアカウントを持っている方多いと思います。

ただですね、ログインも不要で、

まずは試してみたいという人は、

ハギングフェイスがおすすめですね。

こちらもAI系のプラットフォームのようなものですね。

09:00

概要欄にフラックスワンを使う方法を書いた記事のリンクを貼っておきます。

気になる方はぜひチェックをしてみてください。

ちょっと話は変わるんですけど、

私以前のポッドキャストでこう言いました。

2024年は動画生成AIの年になるかもしれないと。

こう発言した背景には、

オープンAIがソラを発表したからですね。

オープンAIがソラという動画生成AIを発表したからです。

発表当時デモ動画を見た方って結構いらっしゃると思うんですけど、

やっぱりですね、すごいものが出てきたと驚きました。

これは結構他の方もみんな驚いたと思います。

残念なことにこのソラっていうのはまだ一般公開されてないんですね。

ただですね、これまでにソラ以外の動画生成AIっていうのも

2024年になってから結構発表されています。

例えばルマンAIがリリースしたドリームマシンですね。

以前のポッドキャストでも取り上げました。

あとはクリングなんかも最近出てきています。

これは中国の生成AIですね。動画生成AIですね。

こんな感じで2024年はですね、

結構動画生成AIの界隈っていうのが盛り上がっている印象があります。

動画生成AIを話す時に切っても切り離せない関係っていうのが

画像生成AIだと思うんですね。

AIで動画を作るには大きく分けて2つのアプローチがあります。

1つはテキストから動画を生成するパターンですね。

例えば猫が走っている動画を作ってというようにテキストから動画を生成すると。

もう一つのパターンというのが画像から動画を生成するパターンですね。

例えば私がコーヒーカップを持っている男性の画像を

AIに投げたとします。

この画像をですね、コーヒーを飲んでいる動画にしてという風に指示をすると、

その画像を元に動画が生成するというものになります。

なのでクオリティの高い動画や、

あとは自分が反映したいもの、こういった動画を作りたいという時には、

画像生成の要素というのも外せないものなんですね。

なので動画生成AIの進化や、あとはニーズの高まりと一緒にですね、

画像生成AIも引っ張られるような形でどんどん進化していくんじゃないかなと思います。

話は変わってDARI3ですね。

このDARI3というのはオープンAIが開発する画像生成AIですね。

オープンAI、ChatGPTの開発会社ですね。

DARI3はChatGPTの有料プランのみ今まで利用できました。

お金を払わないと使えなかったわけですね。

ただ最近ですね、ちょうど先週ぐらいですかね、

最近無料ユーザーも使えるようになりました。

例えばチャット上からですね、ChatGPTのチャット上から猫の写真を生成して、

なんて指示すると猫の画像が生成できるというものになります。

この無料版の場合はですね、1日に制限できる画像の枚数が2枚という条件があります。

12:04

割と条件は厳しめなんですけど、もともと無料プランでは利用できなかったので、

今回のアップデートっていうのはありがたいですよね。

使い方っていうのも非常にシンプルです。

ChatGPTの画面の左側にGPT図の表示がありますよね。

GPT図、チャットボットですね。

そこからダリスリーを選んでチャットを開始するだけでOKです。

DALLEと書いてダリと読むアイコンがあります。

こちらをクリックして新しくチャット画面を開いて、

指示することで画像を生成することができます。

AIへの指示をする時っていうのは、英語、日本語、どちらの指示でもOKです。

例えばフラックスワン、先ほど紹介したフラックスワンっていうのは、

日本語の指示はほぼほぼダメなんですね。

ただダリスリーは日本語でも指示ができます。

私もダリスリーを使っているんですけど、

例えば記事のアイキャッチ画像を作ったりとか、

あとはAI講座の資料に挟む画像、

そういったものを生成したい時に使っています。

業務で使う場合っていうのは、スライド資料で使う画像なんかでしょうか。

ちなみにこのダリスリーっていうのは、商用利用OKです。

以前はですね、こういった画像っていうのは、

フリー素材のサイトから見つくろっていました。

ただですね、今はAIで画像を用意できると。

自分が欲しい画像をAIに伝えると、

AIがその指示に沿った画像を返してくれると。

これはやっぱり、AIがなかった頃にはできなかったことなので、

結構便利なんですね。

最後に少し現実的な話をしましょうか。

ここまで画像生成の魅力であったりメリットっていうのを話してきました。

ここからはですね、利用規約をちょっと交えた、

少しちょっと固めのお堅い話をしていきたいと思います。

見落としがちなんですけど、

仕事でAIを使っていく上では大事な部分になるので、

ちょっと話したいと思います。

まずFlux1の利用規約についてちょっと話したいと思います。

Flux1の公式サイトに利用規約に関しての記載があります。

結構長いのでかいつまんで説明すると、

まず画像の権利ですね。

画像の権利がどうなるのかという点ですね。

規約を見ると、ユーザーが出力した画像っていうのは、

その所有権、これはですね、

Black Forest Labは主張しないと書かれています。

つまり会社側はユーザーが生成した画像に関して、

所有権を主張することはありませんよと。

ユーザーが出力した画像っていうのは、

個人の使用や商業的な目的で自由に使用できますよという話ですね。

商業利用の場合は、プロのモデルですね。

プロのモデルで出力した画像というのが商業利用できます。

あとは画像生成AIの特色上ですね、

場合によっては似たような画像が生成されるケースも出てくると思います。

例えば、私があるプロンプトでイラストを生成したとします。

例えばそうですね、猫の画像を生成したとします。

15:01

他の方がですね、たまたま似たようなプロンプトで似たようなイラストが生成されたと。

同じような猫の画像が生成されたと。

こうしたケースではですね、私が例えばおいおいと、

あなた私と同じ画像を持ってるじゃないのと、

それ私が生成した画像だから、この画像の著作権は私にありますよっていうのは言えない

というふうに利用規約に書かれています。

こうしたケースではこういった可能性がありますよと、

そういった可能性があることを認識して、

他のユーザーがその画像を使用する権利を持つことを認めてくださいねという話ですね。

似たようなプロンプトでは確率的に言えばですね、

同じような画像が生成される可能性というのはまあまああるわけですね。

Flex1の利用で損害が生じた場合、これ結構大事ですよね。

例えば私があるイラストを生成しました。

で、それがある現実のですね、イラストレーターの作品に酷似していたと。

で、私自身はそのプロンプトを出力するときにですね、

そのイラストレーターの作者の方の名前を入れたわけじゃないんですね。

ただ、故意的にやったわけではないけど、

たまたまある特定のイラストレーターの方の作品に似通ったものが出てきたと。

で、私はそういったことを知らずに、生成された画像っていうのを商業目的で利用していましたと。

で、するとそのイラストレーターの方に著作権支払いをして、

で、するとそのイラストレーターの方に著作権侵害で私が訴えられたと。

こうしたケースではですね、フラックスワンの利用規約によると、

ブラックフォレスト側、つまり会社側ですね、会社側は一切感知しませんよというスタイルですね。

結構これは他の画像生成AIでも多いですね、こういったスタイルっていうのは。

生成した画像に関して会社側は所有権を主張しませんよと。

で、仮にユーザーが生成された作品ですね。

生成された作品、画像に対して、例えば他の誰かから訴えられたと、著作権侵害で。

そういった場合では会社側は一切感知しませんよと、ご本人で解決してくださいよという話ですね。

これはですね、画像生成AIを使う上で、頭の中に入れておかないといけない部分ですね。

ちなみに画像生成AIのダリ3ですね、OpenAI、ChatGPTで使える画像生成AI。

こちらも商業利用は可能です。

生成した画像、これはですね、コンテンツとして販売してもいいですよと、商業目的で利用してもいいですよと明記されています。

ただですね、こういったコンテンツに関して何か問題が起きた時、先ほどのようなケースですね。

そういった問題が起きた時はユーザー側で解決してくださいねっていうスタンスですね。

この点はOpenAIもBlack Forest Labも一緒ですね。

ただですね、ダリ3に関しては、基本的に何らかの侵害をするであろうプロンプトっていうのは、弾く仕様になっています。

例えばですね、テイラースイフトの画像を生成してとか、そうですね、ドラゴンボールの悟空の画像を生成して、

18:06

こういったですね、何らかの侵害をするであろうプロンプトっていうのは、事前に弾かれるようになっています。

特定の人物やキャラクターっていうのを指定してもプロンプトは弾かれるような仕様になっているわけですね。

一方でFlux1に関しては、ここら辺はですね、ちょっとはっきり言ってザルな印象ですね。

普通に著名な人とか、あとはキャラクターの名前などをですね、プロンプトに入れると普通に生成されてしまいますね。

なのでユーザー側で注意しないといけないと思います。

何らかの権利を侵害する可能性があるプロンプトは、入力しないようにしないといけないわけですね。

このように画像生成AIを使う時っていうのは、こうした権利関係や法律の問題、こういった問題が絡んでくる可能性があるっていうのも覚えておく必要があるわけですね。

特に企業が業務で画像生成AIを使う時っていうのは、こういった権利関係や法律、利用規約がどうなっているのかっていうのは、切っても切り離せない考えだと思います。

こういった話を聞くと、業務で画像生成AIを使うっていうのはちょっと及び越しになってしまいますよね。

何かあった時っていうのは会社は責任を取ってくれないという、そういった部分があるからですね。

こうしたケース、例えば企業が画像生成AIを使いたい時、こうしたケースは今のところはですね、最適解はFireflyでしょうか。

Fireflyはですね、Adobeが開発する画像生成AIですね。

Adobeっていうのは結構有名だと思うんですけど、フォトショップとかイラストレーターなんかのソフトを開発している企業ですね。

AdobeのFireflyっていうのは、モデルの学習にフリーライセンスの画像素材とか、あとは画像の所有者から許可を得たAdobeストックの作品っていうのを利用しています。

つまりですね、権利関係で問題のない学習データっていうのを使用しているわけですね。

こういった点というのは、他の画像生成AIにはあまりない取り組みだと思います。

ユーザー側としては、どういった学習データを使っているのかわからないっていう画像AIよりもしっかり学習元の安全性なんかが担保されているAIの方が使いやすいですよね。

なぜなら、そういった著作権侵害などで訴えられる可能性というのが低くできるからですね。

Fireflyのエンタープライズ版というプランがあります。

ちょっとお高めのですね、企業版のプランになります。

このエンタープライズ版だと、仮にユーザーがですね、Fireflyで生成したコンテンツで訴訟を起こされたとします。

そうした場合でも、Adobe側が全額保証しますよというふうに言っています。

これは自分たちの学習データに自信があるからでしょうか。

万一、万が一訴訟を起こされても、うちがしっかり面倒見ますよという話ですね。

一応ですね、オープンAIにも似たようなシステムはあります。

21:02

オープンAIのエンタープライズ版で利用できるコピーライトシールドというものですね。

これはですね、去年の冬ぐらいですかね、新しく追加されたものになります。

簡単に言うとですね、これはオープンAIを利用する中で、ユーザーが著作権侵害の訴えを起こされたとします。

そういった場合はオープンAIが介入をして、訴訟に関する費用を持ちますよというものですね。

こんな感じで企業が画像生成AIや何らかのAIを使うときに、万が一何か問題が発生したときに、

その提供する企業側がどのような対応してくれるのかっていうのも見逃せないポイントだと思います。

ものすごく高品質な画像を提供してくれると。

でも利用規約周りっていうのは全然整備されていない。

これだとやっぱり仕事で業務で使いにくいですよね。

私もですね、画像生成AIとか動画AI、あとは音楽ですね。

いろいろこう使ったりはするんですけど、やっぱりどうしても目が行きがちになるのは品質ですよね。

いい絵が生成できる、いい音楽が生成できる。

どうしてもそういった部分に目が行きがちなんですけども、

それとは違うバックグラウンドと言いましょうか、利用規約周り、権利関係、

こういった部分もですね、総合的に見ていかないといけないと思います。

私も次回を込めて気をつけていきたいと思います。

はい、それでは今日のポイントをまとめます。

一つ目に、FLUX1はステイビルディフュージョンの開発者が創業した企業。

高品質な画像を生成できます。

二つ目に、FLUX1はオフライン、もしくはオンラインで利用できます。

簡単に利用するとするならば、オンラインのハギングフェイスがおすすめです。

使い方の手順は概要欄にリンクを貼っておきますので、興味のある方は参考にしてみてください。

三つ目に、画像生成AIは利用規約もセットで確認しましょうね、という話をしました。

少しですね、現実的な話をしました。

権利周りでしっかりしているのは、現状ファイアフライだと思います。

Adobeの画像生成AIですね。

はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。

前回、初の番組企画を行いました。

リスナーの方に、あなたのAIの使い方を教えてくださいというものでした。

ありがたいことにたくさんのご応募いただいています。本当にありがとうございます。

採用された方にはAmazonギフト券2000円分ですね。

投票期日は明日までになります。8月の15日までですね。

採用された方はメールでお知らせをします。

こちらも概要欄にリンクを貼っておきますので、

まだ参加していない方は明日までなので、ぜひご参加いただければと思います。

次回以降のポッドキャストで、採用された内容を順次話していきたいと思います。

このように番組ではAIの情報を毎週発信しています。

水曜朝に更新していますので、ぜひフォローお願いします。

24:03

XとノートでもAIの情報を発信していますので、こちらもぜひ。

AAを学べる講座も提供しています。概要欄にリンクを貼っておきます。

お相手はロボシンクのヤノでした。また次の配信でお会いしましょう。

スター

エピソードをシェアする

メッセージを送信

矢野哲平

スター

コメント

こちらもおすすめ

#31 Black Forest Labsが発表した画像生成AI、FLUX.1をレビュー🎨

エピソードをシェアする

矢野 哲平

コメント

こちらもおすすめ

矢野哲平