1. アシカガCAST
  2. 音声ファイルから自分が喋って..
2020-11-04 05:47

音声ファイルから自分が喋ってる動画が作れる Deep Word(第352回)

10秒くらいの動画と音声ファイルをアップロードするだけで、自分が喋ってる動画をAIで生成するサービスを試した話です。ポッドキャストをYouTubeにアップするのに使えるか考えてみました。

■Deep Word
https://www.deepword.co/

=== 目次 ===
オープニング by ムスメ
自分が喋っている動画をAIで生成させるサービスDeep Word
実際にポッドキャストを自分に喋らせてみた
このサービスをポッドキャストの動画化に使うとしたら
Deep Wordのプランについて
悪用対策は人による手動チェック
しめの言葉
-------
#アシカガCAST
デジタル活用のヒントを与えられることを目指した
・各回ワンテーマ(余計な近況報告ナシ)
・5分くらいでさらっと聴ける
ポッドキャストを基本週5回(月〜金)配信しています。

#ラジオ #ポッドキャスト

■Twitterアカウント
https://twitter.com/ashikagacast

■Facebookページ
https://www.facebook.com/ashikagacast/

■アシカガCAST コミュニティ on Spectrum
https://spectrum.chat/cast

Apple Podcast、Spotify、Google Podcast、YouTubeなどで配信しています。

■Apple Podcast
https://podcasts.apple.com/jp/podcast/%E3%82%A2%E3%82%B7%E3%82%AB%E3%82%ACcast/id1471540766

■Spotify
https://open.spotify.com/show/7JhT3snKrz5TnWzwB7xOq6

■Google Podcast
https://www.google.com/podcasts?feed=aHR0cHM6Ly9hbmNob3IuZm0vcy85MjMxOTYwL3BvZGNhc3QvcnNz

■YouTube
https://www.youtube.com/channel/UCj09Ciw-xGZheDKJ8NObJtw

アシカガCASTを支援しよう🥤
■アシカガ コウジ on Buy Me A Coffee https://www.buymeacoffee.com/ashikagacast
00:00
ポッドトラックB4を貸してもらったよ、アシカガキャスト。
ポッドキャストの音源をYouTubeにアップするために、どうやって動画にするかという話を、何度かこのポッドキャストでしてきました。
今回紹介するのは、ある意味その決定版と言えそうなんですが、
自分が喋っている動画をAIで生成させるサービス、ディープワードというものです。
ディープラーニングのディープに単語のワードですね。
人物が喋っている10秒くらいの動画ファイルと音声ファイルとをアップロードするだけです。
その人物がその音声ファイルを喋っているような動画を作ってくれます。
ある意味ディープフェイク動画ですよね。同じ仕組みですね。
私が喋っている10秒くらいの動画を撮影して、ポッドキャストの音声で実際に動画を作ってみました。
口元の映像が常にちょっとぼやけているような感じで、口の開き方も結構違和感があるなと私は感じたんですが、
それをツイッターにアップしました。
そしたらそれを見た人からリアクションがあって、ツイッター上でコメントでちょっとやりとりをしたんですね。
その人はその動画に対して違和感を感じなかったと言っていました。
その理由は一つはスマホの縦画面で見たからと。
横長の動画をツイッターのスマホの画面で縦画面で見ているので、
サイズが結構小さいので口元のもやっとした感じが気にならなかったんだと思います。
私もスマホでツイッター上で見た時にはそんなに違和感は気になりませんでした。
あとそもそもその人は私と会ったこともないし、顔も見たことないという点も大きかったんじゃないかと思います。
私が違和感を感じたのは自分を見慣れているからで、見慣れてない人にとってはそんなに気にならないということはあると思います。
このサービスをポッドキャストを動画にする時に使うとしたら、毎回新しい動画で作りたいですね。
10秒くらいの喋っている動画が一個あれば次々ポッドキャストを喋らせることはできるんですが、
やっぱり見てる側としては見飽きると思うので、服装が違ったり髪型が違ったりしている日々違う動画の方が面白いと思います。
03:03
じゃあ毎回ポッドキャストを撮る時に動画も撮ればいいじゃないかと思う人もいるかもしれないんですが、
私の場合はコマ切れに切りながら撮りながら編集しているので、それを動画でやるというのがあまり現実的じゃないと思うんですね。
ポッドキャスト一発撮りの人も結構いますが、編集している人も多いので、最終的に編集して完成した音源を喋らせられるというのはメリットが大きいと思います。
顔出ししなくていいからポッドキャストをやっているのにという人は違う人に喋らせるというのもマーケティング的にありかもしれないですね。
自分よりも顔面偏差値が高いと思う人にお願いして10秒くらいの動画を撮らせてもらえばその人が喋っているようにできるわけですね。
金額の話ですが、無料プランで作れる動画は月に5本、1本の長さが1分まで、なおかつフルHDではなく720pとちょっと解像度的に低くなります。
有料のプランが月に14.99ドルからで1500円くらいですね。フルHDサイズで作れるんですが、月に10本、1本の長さは6分までとかなり制限があります。
さらに上の月34.99ドルのプランでも1本の動画は6分までという制限がやっぱりあります。そのプランだと月30本まで作れます。
私のポッドキャストはちょうど1本5分台で作っているので6分以内に収まるんですが、基本平日毎日更新で月10本では収まらないので、このサービスでポッドキャストを動画にするんだったら月3500円くらいかかるわけですね。
なお、このサービス、有名人に変なことを喋らせたり、悪用される危険があるんですが、現状は人が目で見て問題ないかどうかの確認をしているらしいです。ということで、自分が喋っている動画をAIで生成させることができるDeepWordというサービスの紹介でした。
05:47

コメント

スクロール