天気と動画制作
今日は曇りですね。
ちょっと風も吹いてて、最高気温23度ですかね、予想。
夜9時から傘マークって感じで、またちょっと雨っぽくなっていく。
まあ本当梅雨近づいてるのかな、まだ。ニュースもさ、そんなにしっかり見てないもんで、最近。
つゆ入りしたかどうかも、まだわかってませんが、まだしてないと思います。
今作ってる動画、ようやく完成が見えてきましたね。
金曜日の夕方に公開しようと思って、今妻がテロップを一生懸命作ってます。
映像的にはほぼ完成したので、もう一回ちょっと直して、書き出してって感じですかね。
前回が本当に跳ねて3万回っていうね、タイミングからすべて良かったっていうことでね。
今度はどうかな、今作ってるの。ちょっと心配です。
通常の感じで、1000回、2000回っていうパターンも十分あるんですけどね。
まあこのあたりは、とりあえずアップして様子見るしかないですね。
俺としては、たくさん回数回るっていうのもありがたいんですけども、
前回はね、そのおかげで登録者数がすごく500の前で足踏みしてたんですよね。450ぐらいで。
それはね、その1本で700ぐらいまでいったんで、250人ぐらい増えたんですよね。
今回はそこまでいかないと思うんですが、逆に減らないといいなっていうね、ちょっとネガティブなものを抱えちゃったりして。
まあでもね、ちゃんとした良いものができたとは思うので、ちょっと反応に期待もしてますけどね。
じゃあ、とりあえずながらキャストスタートです。
AIキャンプの報告
この番組は、自分大好きな61歳、私笹行きの声のブログ、声の日記です。
通勤途中に歩きながら、おはようございます。収録してますので、息がはぁはぁ上がったり、周りの雑音騒音、風切音などが入ったりしますが、
何卒ご容赦ください。
ちょっと急ぎ足なので、息がはぁはぁ上がっておりますね。
ちょうど今、電車来ちゃいましたが、今日は乗り過ごしちゃったな。
まあ、仕方ない。
これ急行なんですよ。静岡鉄道の。これだとね、結構早く行くので、これに乗りたかったんですが、今日はちょっと、あれかな。
遅かった。すべてが。
まあ、仕方ないです。
で、今日はね、またAIキャンプの話をしようと思います。
昨日の午後、前回一度ご報告している、AIキャンプという、AIについて学ぶオンラインのハンズオンのセミナーがあったので、それに2回目参加したんです。
そのご報告ですね。
昨日はね、画像生成がテーマでした。
前回もかなりその辺触ったんですけども、
チャットGPT-4Oだっけかな。今のバージョンで結構いい画像が生成できるということで触る、そんなセミナーで。
で、講師の方がノーションのデータを、データというかそのページを作っておいてくれて、
なんだろう、もうすごい便利ね。
講義のアウトラインが書いてあって、そこを開くとさらに細かい内容が出てきて、
実際に打ち込むプロンプトもそこに用意してあって、
で、コピペボタンを押せばコピーできるので、
あとは自分のプロンプトに打ち込めば出るっていう感じ、画像がね。
ただね、自分の環境が悪いっていうのもあると思うんですけども、
無料のチャットGPTなので、そのせいかなと思うんですけど、
もう全然画像が生成されない。これは本当に笑っちゃうんですけども。
まあこれやっぱり課金してないとかなり時間がかかるなっていうのもあるし、
そもそももうそのままなんかどっか行っちゃったみたいな感じのプロンプトもあるので、
そういう場合は講師の方が諦めて、閉じて、新たにもう一遍やった方がいいっていうのはおっしゃってましたけどね。
なかなか時間もかかるし、それに回数制限もあるようで、
なんだかね、10回とかかな。もう途中でもうできませんって言われちゃったんですよ。
昨日の参加者はどうだろう。20人ぐらいだったかな。
十数人から20人ぐらいの間だったかなと思うんですが、
やはり同じような人がいて、無料で使っているので、
結構GEMINIを使ってますっていうのがチャット欄に流れてきて、
GEMINIの可能性
もう僕もJAT GPTで画像生成できなくなっちゃったんで、
もうこれはGEMINIでついていこうっていう風に切り替えまして、
今までほとんど触ったことがなかったんですが、
GEMINIを起動して、同じプロンプトをコピーして投げかけてみました。
逆に結構そこはそこで知見がありましたね。
例えば4コマ漫画でレシピを書いてみたいなのをJAT GPTに入れると、
結構ちゃんとしたレシピ、漫画、4コマ漫画ができるんですよ。
日本語もほぼ全くに近いほど問題がなくて、
結構違和感なく、しっかり構成を入れていくつもりで読んでいけば問題は出てくるかなと思うんですが、
ぱっと見気づかないレベルなんですね。
実はGEMINIの方に似たようなことをやらせようとすると、
日本語が破綻しちゃうんですよね。
これはもう歴然とした差があって。
実は前回のAIキャンプの時にも思ったんですけど、
例えば日本の昔話なんかを4コマ漫画で表現できないかなと思っていて、
今回それをJAT GPTではできずにGEMINIでやってみたんですね。
そしたら一コマ目、川が流れているところにでっかい桃があって、桃太郎が生まれて叫んでるのね。
なんとかかんとかって。
そのなんとかかんとかっていう言葉は、これ何語だろうっていう感じっぽいんだけど、漢字でもない。
中国語の簡単な漢字でもないような独自の言語がそこには生まれていて、
でも一応イラスト的にはその4つの絵で物語はある程度表現できてるなとは思ったんですが、
とにかくセリフとかの日本語はもうめちゃくちゃなんですね。
これがおそらくJAT GPTが優れてる、めちゃくちゃ優れてる点だなっていうのをGEMINIを使ってわかったっていう感じがします。
とにかくこの日本語の使いこなしがめちゃくちゃJAT GPTは進化してるっていうのが逆によくわかりましたね。
あとGEMINIの使い込んでるわけじゃないんで、パッと触ったときの違い、弱点、さっきの日本語の話と、
もう一個JAT GPTはこのコンテキストっていうのかな、それまでのJATの内容を反映させることができたんですよ。
これは前回のAIキャンプの時に体験したんですけども、
例えばさっき言ったように卵焼きの作り方を解説する4コマ漫画を描いてみたいな感じにして、
その4コマ漫画を描かせるじゃないですか。
できましたってなったその次のプロンプトで、その4コマ漫画を描いたスケッチブックを持ったおじさんが富士山をバックに笑っているとか、
そういうふうにすると、さっき生成した4コマ漫画の内容を次の生成する映像、画像に反映させられたんですね。
それが結構良くて。今回の中でも、最初に象が地球を打ち返す様子、写真調で横長3対2とかそういう感じで指示して、
象が地球をボールみたいにバットで打ち返しているみたいな映画が出てきた後で、地球を例えばみかんに変えてとか言うと地球がみかんに変わったりとか、
そういう感じで、結構前の画像をベースに変更していくっていうのも得意みたいなんだよね。
この辺がね、JMEはちょっとパッとは分からなかった。もしかしたらできないのかもしれませんけどね。その辺り、やっぱりChatGPTはよくできているのかもしれないなと思いました。
例えばですけども、画像データを与えてテンプファイルみたいにして、それを反映させるのはJMEにも義理できました。
例えば、清涼飲料水を手に持った女の子の笑顔の様子、半分は空間にしてみたいな感じの指示はChatGPTに送った指示とJMEに送った指示と同じような指示で、
割と近いものが出てきました。今度、缶ビールの画像を送信して、その画像のデータを一回持たせた上で、
女の子が持っているペットボトルを今テンプした写真の飲み物に変えてくれって言ったら、まあまあいい感じのものが出てきたので、これはあれかな。
ChatGPTに近い出力が得られましたね。ただ、ChatGPTの場合はもうちょっと感覚的な指示でできました。
要は、缶ビールの画像なんですけども、多分JMEはそれを缶ビールだと認識してくれてないんですよ。
画像生成の比較
だから最初、画像のデータを与えた上で、飲み物を缶ビールに変えてって言ったら、それを理解してくれなかったんですよね。
で、与えた画像、缶ビールのラベルの画像は、なぜか背景に貼り付けられていました。ぼかして。缶ビールのラベルの前に女性が笑っているっていう、清涼飲料水、ペットボトルを持ってっていう出力が出てきましたんで。
この辺りがややこしい。だからそれを理解したので、次のプロンプトで、写真の女性が持っているペットボトル、もしかすると飲み物を今与えた飲み物に変えてって言ったらやってくれたんで。
ビールみたいな抽象的な概念を理解してくれてないのかなっていう気はしたんですね。その辺りもチャットGPTが直感的にプロンプトを支持できる長所かなと思いました。
はい、そんなわけで今日は2回目のAIキャンプのお話をしてきましたが、ジェミンをね、実はちゃんと使ってみるのって初めてだったんじゃないかなと思いますけどもね。
まあ、違いもわかる。いい勉強になりました。ただまあ、本筋はね、そのチャットGPTを使って、まあまあレベルの高い初級編、中級編、上級編とあったんですけどね。
まあそういういろんなプロンプトを皆さんが参加しながら試すっていう企画だったので、途中から使えなくなっちゃったのはちょっと残念でしたけどね。まあやっぱり課金しないとダメなようです。
講師の方、中村さんの話では、今ものすごくそのチャットGPTへのアクセスが増えていて、世界的に見ても3番目だって言ってましたけどね。
なのでその画像生成の負荷がものすごいらしくて、無課金ユーザーはちょっと割と早々に跳ねられてしまうということらしいです。
なのでせめてプラスっていうユーザーがあるらしいんですけど、2000円ぐらいなのかな。それになればもうちょっと優遇してもらえるようなのでね。
本当にチャットGPTで画像生成していくなら、それは必須かなっていう感じはしました。
ただ別の方法としては、さっき言ったジェミンとか、割と最初からずっとやってるやつね、画像生成AIなんかもまだ今も名前出てきたんで、
それはそれで一つ可能性としてはあるのかなとは思いましたけど、とにかくラフなレイアウトを手書きして、パーツとしての画像を読み込ませて、
サムネイルを作らせるみたいなことが割と簡単にできちゃうのは、チャットGPTすごいなっていう感じがしましたね。
ジェミンから離れてチャットGPTに戻るんですが、どんなことをやったかというと、さっき言ったサムネですね。参考にしたいサムネがあったとして、それを読み込ませた上で、タイトルはこうしろっていうような指示をして、タイトルを書き換えさせちゃうっていう方法がありました。
それはね、人物の切り抜き写真が右下にちょっと小さめに置いてあって、タイトルが青いバックでね、ビジネスっぽいYouTubeのサムネらしい感じで、タイトルだけ変えるっていうのも割と簡単にできてましたね。
ただ、日本語の能力が上がったとは言っても、ちょっと気になるところがあったりはします。ここで開業するの?みたいなのもあったりとか、文字がちょっと抜けちゃってたりとかね。そういったことはあるけど、精度は高い。
あとは、ちょっとレベルが高い話になりますけども、与えるプロンプトもどうも書式があるらしくて、ChatGPTの。例えばタイトルって、コロンなんとかかんとかで書くとかね。
あとそういう位置の指定、例えばサイズを700×700ピクセルにして、ロゴのデータを与えるとして、ロゴの位置を例えば50、50っていうね。右、左上の角をゼロゼロとしてですけども。
50ピクセル、50ピクセル離れたところに、このロゴのデータを置いて、幅は何ピクセルにして縦はなり行きオートにしてみたいな感じで、結構細かい指示を与えていくことで、希望のレイアウトに近づけていくこともできるようで。
そういう結構長いプロンプトですね。色指定もRGBで指定したりとかっていうこともできるみたいなんで。
講師の方が言うには、同じようなフォーマットで似たような講座をやる場合に、そのプロンプト自体をコピって日付だけ変えるとかね、そういう使い方ができますなんて言ってましたね。
俺みたいに頭が硬い古い人間は、PSDファイルで日付だけ変えるだけじゃん、テキストの部分を。と思ったりもしましたが、それを言ってたらね、AIの省力化ってできないので。
そういうわざわざフォトショップを起動しなくても、チャットGPTの中で生成できるっていうのは、それはデザイナーでなくても、フォトショップの操作を知らなくても、そこのテキストだけ変えればいいっていう環境にしておくっていうのが、価値があるとも言えますね。
そんなところで、かなりプロンプトの書式っていうのは、凝った指定ができるっていうことも勉強になりましたね。ただ、課金しないと使えない。
俺はね、昔話を4枚の絵にするっていうことをやりたいなと思っているので、4コマ漫画でなくてもいいんだけど、4つのイラストで昔話を表現するっていうのができたらいいなと思っているので、
まあ、やっぱりチャットGPじゃない方法、ジェミニでできないかなって、今、無料でできないかってケチですけどね、思ったりもしております。というところで今日はおしまいです。最後までお付き合いいただきましてありがとうございました。ではまたね。