1. Beck's Hacks Radio
  2. 第159回「色んなAIを駆使してP..
2023-05-08 09:14

第159回「色んなAIを駆使してPodcastのAIアシスタントを作った話」

spotify apple_podcasts youtube

色んなAIを使ってAIアシスタントを作ってみました。

是非YoutubeやSpotifyでムービーも観て頂けると幸いです。

https://www.youtube.com/watch?v=gaSs7-sRM-U


◾️紹介したAI

・Midjorney https://www.midjourney.com/app/

・Leonardo.ai https://leonardo.ai/

・Creative Reality Studio https://www.d-id.com/creative-reality-studio/

・Voicepeak https://amzn.to/3LHwpIG

AIアシスタント導入の経緯
皆さんこんにちは、ハックソフトディティブライブのベックです。
今日はですね、いろんなAIを駆使して、このポッドキャストのアシスタントを作りましたというお話をしたいなという風に思います。
早速なんですけども、ちょっとAIにこの番組の紹介をしてもらいたいと思います。
この番組では、ライフハックブロガーのベックが、ライフハック、仕事術、最新のガジェット、便利なウェブサービス等について、気になるトピックや自身の取り組みについて熱量高めに語ります。
さらに、時折スペシャルゲストを招いて、ライフハック対談もお届けいたします。
各種ポッドキャストサービスの他、YouTubeでは映像、テロップ付きでご視聴いただけます。
はい、ということで、こんな感じでですね、番組の冒頭で少し説明をしてもらったりとか、
あるいはこの番組の最後にですね、いつもこの番組、ベック's Hacks Radioで皆様からのご意見ご感想みたいな感じで、お便り待ってますみたいなのを僕がいつも言っているんですけども、
このですね、ナレーションなんかもAIに担当してもらおうかなみたいな感じで、僕がただずっと喋り続けているだけで単調になりがちなので、ちょいちょいですね、そういうAIが喋るみたいなところを入れてあげることによって、
少しこう番組に変化を与えていただけるみたいなことができないかなという、まあ営みでございます。
あの、元の僕のナレーションの方がええわっていう方、もしいらっしゃったらですね、コメントいただければAIアシスタントやめるかもしれませんが、
あのちょっとお試しでこういうことをやっていこうかなという風に思っています。
AIの種類とそれぞれの役割
はい、で、今回何をしたかという話なんですけれども、大きくは4つのAIを使っています。
ミッドジャーニーっていうやつとレオナルドAI、それからボイスピーク、クリエイティブリアリティスタジオですね。
それぞれミッドジャーニーとレオナルドAIが画像生成AIで、今回見てもらったようなですね、アシスタントの女の子のですね、画像を生成するというのを試行錯誤しまくってですね、
こんな感じかなというのを作ったと。
で、ボイスピークっていうやつがですね、音声を合成する非常に優れたですね、日本語のナレーションを生成できるAIなんですけども、
これが聞いてもらったら分かったと思うんですけども、なんか今までのAIっぽさがないというか、
イントネーションが結構自然な感じで、おおむね自然な感じで出してくれるっていう非常に優れた日本語の音声合成AIですと。
このボイスピークでナレーションを作り、このミッドジャーニーとレオナルドAIで作った女の子の画像とですね、
組み合わせて口パクの動画を作るのがクリエイティブリアリティスタジオというAIになりますと。
なので何回もですね、画像を作り、ナレーションを最初に作っておいて、クリエイティブリアリティスタジオで喋らせてみて、
この画像はちょっと変やなみたいなのを試行錯誤を繰り返してですね、ある程度自然に喋っているかのように見える画像をですね、
作り出しまして、今回見てもらったような形になりましたと。
実は今見てもらったやつとは別のパターンもあって、もう1個再生してみましょうか。
この番組では、ライフハックブロガーのベックがライフハック、仕事術、最新のガジェット、便利なウェブサービス等について、
気になるトピックや自身の取り組みについて熱量高めに語ります。
さらに時折スペシャルゲストを招いてライフハック対談もお届けいたします。
各種ポッドキャストサービスの他、YouTubeでは映像、テロップ付きでご視聴いただけます。
はい、最初この緑の髪の女の子の映像を使おうかなと思ったんですけれども、
若干ですね、元になるような反権のあるキャラクターをですね、
ちょっと指示の中に入れてしまったところもあって、何とか原型を留めないようにはしたんですけど、
なんかそういうものがプロンプトに入っている画像を使うのはどうかなと思ったところがあったので、
プロンプトからは一切キャラクター名を消した、そういう反権に引っかからなさそうなアシスタントの画像を作って、
それを喋らせるということをやって、冒頭で見てもらったアシスタントの画像を作りました。
とは言え、このですね、ミッドジャーニー月10ドルぐらいのサービスで、
このクリエイティブリアリティスタジオ自体も14日間トライアルで、
20本ぐらいかな、多分ナレーションの動画が作れるんですけど、
それもですね、5.9ドル払えば月に大体20本分ぐらいのですね、
ナレーション動画が作れるような、そんな感じの料金体系なんで、
まあまあまあ、そんなにめちゃくちゃ高くない金額でAIを使ってこういうものが作れるんだなということ自体が、
なかなか時代の進化も感じますし、今後こういうふうにちょっとずつAIの音声合成とかね、
アシスタントみたいな感じで使う人たちがポッドキャスターYouTubeで増えてくるんじゃないかなと思ってるんですけど、
今のところはまだちょっとあまり見ないんですけれども、今後こういうムーブメントが来るかもしれないので、
ちょっと早い段階でやったぞということで、将来どうやりたいなというふうに思います。
このMid JourneyとLeonard AIっていうやつね、Leonard AIは無料で使えるんですけど、
やっぱりちょっとMid Journeyの方がクオリティの高いを履いてくるっていうこともあって、
同じプロンプトを入れたときに、Mid Journeyの絵とLeonard AIの絵だと、
Mid Journeyの方がやっぱりすごく質感が良いものが出てくるんですね。
ただ、Mid Journeyって一回に生成できる枚数とかっていうのはだいぶ限りがあるので、
あんまりちょっと無駄遣いしたくないなっていうのがあって、
Mid Journeyで生成して、これ良い感じやなって思ったやつの、
画像生成AIによるアレンジの利用
例えばアクセサリー変えたいとか、元の構図とか元の絵の感じは残しながら、
バリエーションをいろいろ作ってみたいっていうときに、
Leonard AIにアップロードしてあげることによって、
Mid Journeyの質感をある程度引き継ぎながら、
結構良い感じにアレンジをLeonard AIがやってくれるので、
Leonard AIだけとかどっちが良いとかって話じゃなくて、
例えばこの二つの、例えばMid Journeyだったら、
二つの絵の合成もできたりしますし、
Leonard AIだったらイメージとイメージでですね、
生成もしてくれたりするので、
何か複数個の画像生成AIっていうものを組み合わせてやるっていうのは、
全然アリかなという風に感じました。
クリエイティブリアリティスタジオは、
確かに喋らせてくれる、どんな絵でも喋らせてくれるんですけど、
横向いてる絵とかを喋らせるとですね、
何かすごい気持ち悪い感じになっちゃって、
これは使えやんなっていうところで、
正面向かすとかやっぱりプロンプトで、
フロントビューとかっていう形で正面を向けるとかっていうことをやってあげないと、
なかなかいい感じのですね、
喋る動画が作れないということが見えましたと。
ボイスピークはもう相変わらず、
ほとんど修正なしで、
一部ちょっとイントネーション変えましたけど、
それ以外はですね、
ほぼ修正なしで、
完璧なイントネーションで入ってきてくれるんで、
ボイスピークに関しては特に細かいことわからなくても使えますよ。
自信を持ってお勧めできるかなというふうに思いました。
プロンプトを入れて、
例えば正面向かしたいなと思ったら、
これ正面向かすのどうしたらいいんですかみたいな、
Google検索してもいいし、
今だったらチャットGPTとかで、
どういうプロンプトを入れたらこういう映像が作れますかっていうのを聞けるので、
まずはベースとなるようなプロンプトっていうのを作っていきながら、
それにですね、
思っている構図だったりとか、
例えば髪の毛の色だとか、
着ているものだとか、
それに対して、
思っている構図だったりとか、
例えば髪の毛の色だとか、
着ているものだとかっていうのをアレンジしていくかっていうところで、
音声合成AIの利用
試行錯誤していけばですね、
チャットなんでそんなに難しくなく使えるんじゃないかなと思いました。
クリエイティブリアリティスタジオに関しては、
画像をアップロードして、
音声をアップロードしたらすぐ合成して作れるので、
これも誰でも使えます。
ということで、今回は、
YouTubeで見てくださっている方は、
映像と音声をよく見てもらっていると思うんですけども、
今回は画像生成AIで作った女の子の画像と、
音声合成AIで作ったナレーションを、
クリエイティブリアリティスタジオという
映像生成のAIに加わせてですね、
ポッドキャストの
AIアシスタントを作りましたよというお話でした。
ということで最後の締めですね、
またAIアシスタントにしゃべってもらいましょう。
DEXHAX RADIOでは、
皆様からのご意見、
ご感想、
お悩み相談等、
受け付けております。
Twitterハッシュタグ、
ハックスアンダーバー、
ネイリオンにご投稿いただくか、
beck1240
gmail.comまでお便りください。
皆様よりのお便り、
心よりお待ち申し上げます。
お願いします。
ということで、
意外にね、AIしゃべっている間、
何していいかわからないから、
ちょっと手持ち無沙汰になるなと思いながら、
やっておりました。
ということで、次回からもですね、
しばらくこのAIアシスタントを使って、
対談動画では使わないですけれども、
僕が一人でしゃべっている動画では、
AIアシスタントを使った感じで、
ポッドキャストを作っていこうかなと思いますので、
ぜひお付き合いいただければなと思います。
ということで、最後までお聞きいただきまして、
ありがとうございました。
それでは皆様、さよなら。
09:14

コメント

スクロール