1. むらスペ
  2. ChatGPTの画像生成AI、Dall-E3
2023-10-18 21:36

ChatGPTの画像生成AI、Dall-E3

前のバージョン、DALL-E2に比べると、はるかに画質が上がりました。今回のサムネ(タイトル画像)もDALL-E3で作っています。

--- Send in a voice message: https://podcasters.spotify.com/pod/show/murasupe/message

サマリー

2023年10月18日、インドでは「むらスペ」というTwitterの音声配信が始まりました。政府は日本語教育に大規模な投資を行っており、また、Dall-E3やChatGPTについての画像生成AIについても話しています。それぞれのAIについて、画像生成の品質や問題点についても話し合われています。

Twitterの音声配信「むらスペ」
冒険家のみなさん、今日も落雷に揺られて灼熱の砂漠を横断していらっしゃいますでしょうか。
本日は、2023年10月の18日です。
インドでは午前8時45分を回ったところ、今日もTwitterの音声配信、むらスペを始めさせていただきたいと思います。
どうぞよろしくお願いいたします。
今日は、ChatGPTの画像生成AI、Dall-E3というタイトルでお話をしたいと思います。
リスナーの方が集まる間に、最初にいくつかお知らせをしておきたいと思います。
まず一つは、Zoomで鼻筋です。
今日は水曜日なので、あさってになります。
今のところ、乾杯の温度は、青山美香さんに園芸療法についてお話をいただくことになっております。
それから部屋が2つあって、1つが日本語教育への政府による大規模な抗菌の投入。
こういうトピックでQFTをやることになっています。
QFTというのは、みんなで質の高い質問を作る活動です。
もう一つの鼻筋の部屋が、今日ご紹介するDall-E3という画像生成AIのことです。
それから、日本語教師映画パーティーは、今週の土曜日、
世界で一つの彼女、人工知能に恋をしてしまった男性の物語です。
ホワキンフェニックス主演で、もう10年前なんですが、結構話題になった映画だと思います。
今まさに人工知能の時代になったので、
10年前のこの映画を今振り返ってみるというのは、とても意味のあることなんじゃないかなと思います。
日本語教師ブッククラブは、今月はビジネス日本語教え方&働き方ガイドを読んでいます。
日本語教師チャットは、2つのトピックがあって、その投票中です。
一つは、ソシュールvsチョムスキー、もう一つはポッドキャストです。
ソシュールvsチョムスキーの方は、提案理由が面白そうだから、という風になっています。
ポッドキャストの方の提案理由は、皆さんが聞いている、発信しているポッドキャストを知りたいです。
プラットフォームも教えてください。学習者におすすめのポッドキャストは何ですか。
勉強用に聞いている番組はありますか。英語の番組も聞いていますか。
こういう提案理由ですね。
それでは、まず音声が聞こえているか確認したいんですけど、
今いるリスナーの方で、運転中とかでない人がいらっしゃいましたら、
僕の声が普通に聞こえていったら、ハートのマークでリアクションいただけますかね。
リアクションマークというのは、画面の下の方にあって、ハートプラスとかそういうのがあると思いますね。
それでリアクションできます。
あと、余裕がありましたら、村スペ聞いてますとかね、ツイートしていただけたら大変ありがたいです。よろしくお願いします。
Dall-E3の特徴と商用利用化
それでは、本日の本題に入ってみたいと思います。
今日お話ししたいのは、ChatGPTの画像生成AI、Dally3というものですね。
これを話そうと思ったのは、実はずいぶん前からこれは一部の人では使えていたんですけど、
インドではですね、僕が今住んでいるインドからChatGPTにアクセスしても、まだ使えない状況がしばらく続いていたんですね。
数日前に僕がアクセスしてみたら、ようやくこれが使えるようになっていたので、
それで僕もこの2、3日いくつか試しをしてみました。
その結果、これは結構使えるんじゃないかということで、皆さんにご紹介しておきたいと思ったわけですね。
じゃあまず具体的な事実としてはですね、
まず名前なんですけど、DALLで中に中点があって、
アルファベットのEですね、そして数字の3が付いています。
読み方は、アルファベットの部分はダリ、ダリと読むらしいですね。
これは多分ですね、サルバトール・ダリのから取ったという説もあるし、
まだあんまり僕が探したところでは明確な理由はわからないんですけど、
サルバトール・ダリのダリから来ていると思っておけば、少なくとも覚えやすいと思いますね。
抽象画像なのかな、抽象画家ではないですよね。
非常に超現実主義、シュールレアリズムのダリ、サルバトール・ダリですね。
それに3番目のバージョンなので3ですね。
ダリ3、そういう風に覚えておけば覚えやすいんじゃないかと思いますね。
これを作ったのはオープンAIという会社で、これはそのChatGPTを作っている会社でもあります。
これまではですね、それぞれ別のサービスとして公開していたんですけど、
今はこのChatGPTの有料版の人がそのChatGPTを開いて、
それでそのGPT4というバージョンを使うと、その中にこのダリ3のそれを使う選択肢が出てくるわけですね。
なので今のところ、無料バージョンでは今のところは使うことができないですね。
あとですね、地域によってはまだ使えないところがあるかもしれません。
インドも本当につい最近これが使えるようになったばかりですので、
その地域によっていつ使えるようになるかというそういう違いはあるようですね。
あとね、これが日本語教師にとって大きな意味を持つのは、これが商用利用化ということですね。
つまりビジネスで使ってもいいということです。
こういうものの中には教育利用はいいけど、ビジネス目的の商用利用はダメですというのがあったりしますね。
そういう時に、日本の法律では株式会社が運営している日本語学校は教育目的の中には入らないんですよね。
なので、商用利用化になってないと株式会社が運営している日本語学校では使えないんですが、
今回のこのダリ3ですね、それは商用利用化なので株式会社が運営している日本語学校でも使うことができると。
Dall-E3の描き分けと文脈保った対話の特徴
ここから先はちょっと僕の個人的な意見なんですけど、実際前のバージョンのダリ2というのがあったんですけど、
それとはもう画質が全く明らかに違うというのは本当にあります。
特に以前のバージョンではもう顔が崩れてしまっていることがとっても多かったんですね。
事故とか病気で実際に顔が崩れてしまっている人たちもいらっしゃいますから、それがダメだというつもりは全くないんですけど、
でもそういう画像をあえて使うとしたらやっぱりそこに何かどうしても意味を感じてしまいますよね、それを見る人にとっては。
なのでそれを普通の教材とかに使うのは正直難しかったと思うんですけど、今回はもう普通に自然な人の顔とかも描けるようになっています。
それからですね、まだ時々指6本とかがあるんですね。
15人ぐらいの人がズームでみんなで手を振っている画像というのを作ってもらったんですけど、
その15人の中に1人指が6本の人が描かれていました。
だけどあとは残りの人は全員普通の指5本の人でしたね。
これももちろん多指小というんですけど、指が多い人は実際にいらっしゃいますから、それがダメだというつもりはないんですけど、
でもそれをわざと入れると、それをあえて教材に使うとそこにどうしても意味を感じてしまう人がいるので、
やっぱり教育上はそれほど使わないほうがいいんじゃないかというふうに僕は思うわけですね。
なのでそういうふうに一般的な顔、そういうものがちゃんと描けるようになったというのは使いやすいんじゃないかと思います。
もう一つは描き分けができるということですね。
今まで僕はですね、ポスターとか作る時にもレオナルドAIというものを使っていました。
これ月8ドルぐらいの有料バージョンを使っていたんですけど、それでも有料バージョンでも1枚の絵の中に複数の異なる人物を入れたりすると、
描き分けができないことがあったんですよね。
例えばインド人と日本人が楽しそうに話し合っているところとかね。
これもやっぱりインドと日本の国際交流に関わっている人間にとってはこういうのは本当にとっても大事なんですけど、
そういうニーズはすごくあるんですけど、
でもそうすると複数の人が楽しそうに話し合っているんだけど、
みんな少しずつインド人っぽくて少しずつ日本人っぽいっていうね、
でもそういうのが出てしまうんですよ。
今度の新しいDARI3ですね、
この新しいDARI3の方ではそれがちゃんと描き分けができるわけですね。
いかにもインド人らしい人といかにも日本人らしい人が楽しそうに話し合っている、
そういう画像を作ることができるわけですよね。
僕はレオナルドAIの方は有料バージョンからまた無料バージョンに変えてもいいかなというふうに今は思っているぐらいです。
あともう一つ、今回のオープンAIが作ったDARI3ですね。
これで今までとは違うのは文脈を保った対話ができるということなんですよね。
つまり一回画像を作ってもらって、そこで作ってもらった画像に対して
ここのところだけ直してくださいというふうに指摘すればいいだけなんですよ。
例えばね、今度アニメを使った日本語の授業についてちょっとセミナーをするんですけど、
その時に先生がアニメを使って授業をしている画像をくださいと言ったらですね、
先生がいかにも日本人っぽい先生になってしまったので、
その先生をインド人にしてくださいというふうに変えるだけでいいわけなんですね。
これが今までの画像生成AIだと、最初に先生がアニメを使って授業をしているところというプロンプトに対して、
その先生について修正点を修正したいときはもう一度、今度はインド人の先生がアニメを使って授業をしているところというふうに、
もう一回プロンプトを最初から入れ直さなければいけなかったんですね。
だけど今回はその修正点だけ言えばいいわけです。
その先生がインド人にしてもらったけど、いまいちインド人っぽくないなと思ったら、
じゃあ先生にはサリーを着せてくださいと言ったりすると、
そこが教室じゃなければいけないとか、アニメがなければいけないとか、
教室の前方にスクリーンがあって、そこにアニメが表示されているとかね、
そういうことは言わなくても、その修正点だけ指摘したら、そこを直した新しい画像を出してくるわけですね。
そこが今までとは違うところ。
あともう一つは文字が入れられるということですね。
例えばポスターを作るときとかにですね、
ポスターのタイトルとか日付とか場所とかね、
画像生成の品質と問題点
そういうのもチャットGPTにこういうタイトルで会場はここで、
この日付でやるのでそのポスターを作ってくださいと言うと、
それも作ってもらうことができます。
ただしですね、この文字はまだ今のところ少しバグが多くて、
例えばスペルがよく見るとスペルが違うとか、
そういうこともあったりするので、ちょっとここはまだ要注意ですね。
あとデメリットなんですけど、このダリー3のね、
例えばですね、僕がですね、
冒険家がロボットと握手をしている画像を作ってくださいと言ったらですね、
その冒険家がすごいですね、なんかヒゲもじゃなんですよ。
ヒゲもじゃっていうかね、
いわゆるアーミッシュとかそういう感じのすごいヒゲを生やしている人たちなんですね。
なのでこれはちょっと僕のイメージとは違うので、
その冒険家のヒゲはやめてくださいって言ったら、
はいわかりました、ヒゲのない冒険家がロボットと握手をしている画像を生成しますっていうふうに言うんですけど、
でも実際にはですね、そのヒゲがなくならないんですよ。
何回言ってもヒゲのない冒険家を描いてもらうことはできませんでした。
これはね多分ちょっとさっきの商用化と関係していて、
多分ね、そういうふうにやっていくとちょっとねインディアナ・ジョーンズに似てしまうので、
それを避けるためにわざと違うところをしているように僕には見えましたね。
それの証拠にですね、アジア人の冒険家っていうふうにすると、
ヒゲのない人を作ることもできました。
あとはですね、画質としては非常に写真っぽい画質なんですけど、
だけどそこで描かれていることがちょっと現実的、内容的に現実的ではないので、
おかしいというふうに思うことはたくさんあるみたいですね。
これはですね、オーストラリアのケアンズで日本語学校を経営していらっしゃるミチさんという方が
ツイートしていらしたんですけど、着物姿の女性を描いたらですね、
畳の上でゾーリを履いていたっていうのがツイートされていました。
その後、ミチさんがですね、しのぶえを吹いている、
着物姿の女性がしのぶえを吹いている画像っていうふうに言ったら、
しのぶえが全然本物のしのぶえとは違っていて、
なんかおかしいということもツイートされていましたね。
で、こういう感じで、画質はとてもきれいでリアルなんだけど、
でも画質以外の部分で、畳の上でゾーリを履いているとかね、
そういう部分で初めて見る人でも、これは自然に撮影された写真ではないなというふうに分かってしまうという、
そういうレベルではあります、正直な話ね。
で、これがですね、文章の場合はですよ、
ChatGPTの文章っていうのはもう本当にすごく自然なので、
こういう種類の文章をたくさん読んだ人じゃないと見分けはつかないし、
たくさん読んだ人でも見分けがつかないことっていうのは正直あると思いますね。
だけどこの画像生成の方では、
もう本当に素人が初めて見ても、なんかおかしいと思ってしまうレベルではあると思います。
じゃあ皆さんに今後オススメするかというのは、
Dall-E3の利用について
皆さんの状況にもよると思います。
というのもですね、もうこれはですね、
他のサービスもいろいろこういうものは多分出してくると思うんですね。
というかもうGoogleのBirdっていうね、
ChatGPTのような大規模言語モデルもすでにかなりレベルが高いんですけど、
Googleもですね、AdobeのFireflyっていう画像生成AIと提携していて、
なのでこのGoogleのBirdを使ってAdobeのFireflyを呼び出して、
同じように画像生成AIを作るという予定ももうすでに発表されています。
もう何ヶ月かっていう感じで出てくると思いますね。
皆さんの状況によってオススメするかしないかっていうのは変わってくると思うんですけど、
もし皆さんがChatGPTの有料版をすでに使っている場合はですね、
今回のDally 3はもうそれ以上のお金はかからないんですよ。
なので僕は少なくとも使ってみる、
何回かは使ってみて、それがどのぐらい使えるのかっていうことは試してみる価値はあると思います。
それで皆さんもちろんダメだなと思ったら、
あるいは皆さんのご自分の使い方にとってはあまり良くないなと思ったら使う必要はないんですけど、
でも少なくともお金をかけずにそれを使ってみることはできるので、
まずは使ってみることをお勧めしたいと思いますね。
ですけど、ChatGPTの有料版を使っていない人ですよね。
使っていない人にとっては、
まず語学教師にとってChatGPTというのはものすごく役に立つものなので、
それの有料版を使っていないということは、
それなりに考えて使っていらっしゃらないんだと思いますから、
そういう人にとってはわざわざ、
このDADI-3だけのためにお金を払う必要はないと思います。
今後ですね、Google BirdがAdmiのFireflyを連携して使えるようになると思いますから、
それの出方を見てから決めてもいいんじゃないかなと思いますね。
Fireflyというのも非常に高品質な画像生成をしてくれるところです。
かつ、今のところ無料でも使うことができますからね。
もし、今のところまだ無料で使えるんですよ。
AdmiのFireflyもGoogle Birdも無料で使うことができますから、
これが無料でGoogle BirdからAdmiのFireflyが使えるようになるんだったら、
多分それを待っていてもいいんじゃないかなと思います。
これは今ChatGPTの有料版を使っていない人ですよ。
そういう人だったら、どっちにしろ無料で使えるかもしれないので、
Google BirdでAdmiのFireflyが使えるようになるのを待ってみて、
もしそっちが有料になってしまうんだったら、
じゃあこのChatGPTの有料版を使ってみてもいいかなと比べてみるという感じでもいいんじゃないかなと思いますね。
それでは本日はここまでになるんですけど、
ここにいるリスナーの皆さんでChatGPTのDARI3という新しい画像生成AIを使ってみようと思う方がいらっしゃいましたら
ハートのマークいただければと思います。
まだ自分にはちょっと変がないかなという方がいらっしゃいましたら、
涙のマークいただければと思いますがいかがでしょうか。
それでは本日もムラスペにご参加くださいまして、ありがとうございました。
今日のChatGPTの画像生成AIDARI3、
こういうコンテンツにつきまして感想とかコメントがありましたら、
ぜひムラスペのハッシュタグ付きでご共有いただければと思います。
ハートのマークいただきましてありがとうございました。
それでは本日も良い一日をお過ごしください。
そして冒険は続きます。
21:36

コメント

スクロール