1. ものづくりnoシテン
  2. #137 失われたビデオポッドキ..
#137 失われたビデオポッドキャストのAIで蘇らせてみた結果【生成AI】
2026-04-21 18:19

#137 失われたビデオポッドキャストのAIで蘇らせてみた結果【生成AI】

1 Comment
🎙️内容

録画ミスをAIでカバーした話!!

note記事版👇
https://note.com/sibucho_labo/n/ncd0b4e5f4bd0

————————————————————

リスナーコミュニティ
『オモシロニクスLab🥦』
https://rooom.listen.style/p/sibucho_labo

LINEオープンチャット👇
https://line.me/ti/g2/RU8F8QHdFD94rJHUurT--fn1IIhM8zPjZuXyiQ?utm_source=invitation&utm_medium=link_copy&utm_campaign=default

————————————————————

ものづくりnoシテンが他のプラットフォームでも聴けるようになりました😀

🟢Spotify
https://sibuc.jp/shitenspo

🟣Apple podcst
https://sibuc.jp/shitenapp

⚪stand fm
https://sibuc.jp/shitensta

⚫LISTEN
https://sibuc.jp/shitenlis

🔴Youtube
https://sibuc.jp/shitenyou

————————————————————

📕技術ブログ「しぶちょー技術研究所」
https://sibucho-laboratory.com/

📱X(旧Twitter) ものづくり情報毎日投稿!!
https://twitter.com/sibucho_labo

🎙️Podcast「ものづくりnoラジオ」毎週土曜日!!
🧠Podcast「おちつきAIラジオ」毎週火曜日!!
https://linktr.ee/sibucho

🖊️日刊工業新聞社 専門誌「機械技術」
記事寄稿、連載
https://pub.nikkan.co.jp/search/g103356.html

⭐️日刊工業新聞社とのコラボ企画
『ガチの現役設計者が選ぶ!
しぶちょー&りびぃベストセレクション2024』

全国の書店で開催!
https://pub.nikkan.co.jp/news/n105320.html?tw

拙書
『集まれ!設計1年生、はじめての締結設計』
https://amzn.to/4fVrNf0
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/63cac48a11abafd64722ad6c

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

しぶちょーは最近経験した2つの大きなミスについて語ります。一つはビデオポッドキャストの録画ミスで、Zoomの設定不備により映像が意図通りに撮れていなかったものの、AIを活用してゲストの映像を生成し、見事にリカバリーした経験を共有します。もう一つはワイヤレスマイクを排水溝に落として破損させてしまった物理的なミスで、AIでは解決できない問題と、リスナーからの情報提供によるリカバリーの可能性について触れています。

はじめに:最近のミスと反省
どうも、しぶちょーです。ものづくりの視点は、産業機械の現役エンジニアである私、しぶちょーが、ものづくりに関するトピックを独自の視点で解説する番組です。
いないですけど、皆さん、何かミスをしたことありますか? 最近、何かミスったなあ、これやっちまったなあ、っていうことありますか?
私はですね、実は2回あります。この1週間でですね、ちょっと大きいミスが2回あったんで、今日はその反省というか、何だろう、供養も込めて、その話をしていけたらなと思います。
1個は、ちょっとノート記事に書いたんですけど、一番大きいトピックとしては、私、毎週ね、ポッドキャストを配信してますし、このものづくりの視点に関してはもう毎日配信してますけども、録画ですね、録画録音をミスしてしまったということなんですね。
まあ、それを何とかリカバリしましたよ、みたいなお話をノート記事に書いたんですけど、今日はそれの音声版となります。それでは早速、いきましょう。
ビデオポッドキャスト録画ミスとその原因
何が起こったかというとですね、ビデオポッドキャストを今週収録したんですよね。
ポッドキャストの仲間であります、工業高校農業部という番組のマスモーさんという方にゲストに来ていただいて、ビデオポッドキャストを収録したんですよ。
一応、マスモーさんからですね、Zoomで録画を撮ってたんですけど、顔出しOKですかって言ったら、全然そのまま使っちゃっていいですよって言ったんで、Zoomの録画の画面をそのままビデオポッドキャストにして出したら、いいなと思ってね、それで録画してたわけですよ。
ものづくりのラジオをね、毎週土曜日終日で配信してますけど、ちょっと方針を変えて、ビデオポッドキャスト多めというか、基本ビデオポッドキャストにしていこうかなって今思っていて、
最近よくビデオ出してるんですよ。よく言っても2週間ぐらいですけどね。ちょうどゲスト会でゲスト収録しましょうっていうのがあったんで、じゃあこれはビデオポッドキャストにしようと思って、Zoomで録音していたんですけども、それがですね、撮れてなかったんですよ。
いやーこれはね、ミスですね。
ポッドキャスターあるあるだと思うんだけど、あるあるというか、録音とか録画する人はよくやりがちなんだけど、撮ったつもりで撮ってなかったとかね。
よく言われるのは逆レックっていってさ、録音ボタンあるじゃない?赤いやつね。
あれを2回連続で押してしまって、一瞬しか撮れてないみたいな。だけど自分は1回押したつもりなんだけど、実は2回押してましたよってことで、撮れてないっていうパターンが結構ありますと。
私もね、私のミスではないんだけど、私のミスではないって言っていやらしい言い方なんだけど、おじつきAIラジオっていう番組の方でも、カネリンが1回録画ミスしたことあって、それはSDカードの容量が満杯になってて、途中で録音止まっちゃったよみたいな感じなんですけど、音源が丸々カネリンの方なかったよっていう回が1回ありましたと。
そんな感じでね、結構ポッドキャスターとか音声配信やってる人は1回は必ず録音ミスるんですよ。
でも最悪ね、それはそのまま遅らいになっちゃったりするんですけど、今回は幸いというか、松本さんと私側は音声は撮ってたのね。
自分の喋りの音源は別撮りしていて、映像を私が撮ってるっていう状態だったんだけど、その映像が上手く撮れてなかったんですよ。
上手く撮れてなかったっていうのも、録画ミスしたわけじゃなくて、設定ミスでさ。
この設定ミスもね、俺悪くないと思ってるんだけど、Zoomで通信して喋ってたんだけどさ、Zoomに録画機能、レコーディング機能って付いてるんですよ。
このレコーディングっていうボタンを押すと、お互いの顔が映った状態で音声と動画が撮れるっていう仕様になってるんだけど、
最近のZoomってさ、2種類選べて、クラウドレコーディングとオフラインレコーディングっていう2種類を選べるんですよ。
クラウドレコーディングっていうのは、Zoomのクラウドサーバー側で録画してくれて、そこに後からデータを取りに行くパターンですね。
オフラインは自分のパソコン側で録画しますよ、みたいなそういう機能なんだけど、
後から見返したりとかダウンロードすればいいから、クラウドレコーディングしようと思って、今回クラウドレコーディングにしたんですよ。
それがミスの始まりというか、根本的な間違いで。クラウドレコーディングにすると、これ皆さんももしやる機会があったら覚えてほしいんですけど、
画面に映ってる顔ってクラウドレコーディング側で初期設定した画面になってるわけ。
言いたいことがあるかな、このZoomで会話したことある人だったらわかると思うんだけど、スピーカービューとかギャラリービューとかね、いろいろビューを変えられたりとか、画面共有したりとかできるじゃないですか。
あれって基本的には、録音ボタンを押した人に映ってる画面の設定がそのまま録画されるっていう、そういう仕様なんですけど、
クラウドレコーディングの場合は、クラウドレコーディング設定の設定されている状態っていうのが優先されるみたいで、私の場合はもう本当にギャラリービューじゃなかった、スピーカービューっていう設定になってて、
喋ってる人の顔が入れ替わり立ち替わり大きく映るみたいな、そういう設定になってたんですよ。
ビデオポッドキャストって基本的にスピーカー同士の顔を左右に並べて配信するのが結構スタンダードの画角なので、
それにしたかったですけど、そうなってなかったんですよね。
ということで、すごい使いにくい動画が撮れてしまったんで、ビデオポッドキャスト難しいなということでミスったなという話です。
もしもZoomとかでセミナーの動画とか撮るよという方は、ぜひとも設定気をつけていただければなと思います。
これは罠だなと思いましたね。ということで、ビデオポッドキャストちょっとミスりましたよというお話でございます。
AIによる映像リカバリーの挑戦
ミスったはミスったんですけど、せっかくだからちょっとこれAIで解決しようかなと思って、
AIで架空の動画を作るということをやったというチャレンジをノート記事に書いてありますので、そちらぜひとも見てください。
架空といってもちゃんと音源はあるんですよ。収録した音源があって、ゲストのマスボウさんの収録音源があるから。
私の方の映像は幸いですね、私バックアップとして自分の映像も違うカメラで撮ってたんですよ。
だからそれが残ってたから弱かったんですけど、マスボウさんの方の映像が全くないので、
マスボウさんの声から映像を作ると、口がちゃんと一致しているような映像を作るということを今回AIで行いました。
一応そういうリップシンクロって言うんだけどね、言葉と画像の口を合わせる、そういう動画を作ることをリップシンクロと言うんですけど、
リップシンクロができるような動画生成AIサービスってあるんですよ。それがヘドラっていうサービスがあって、昔それ使ってたんですよね。
それ結構高くて、前そのサービス使って40分ぐらいのビデオポーズゲスト撮ったんですよ。
それも投稿もされてるんですけど、それ作るのに多分2万円ぐらいかかったんじゃないかな、利用料が。クレジット代みたいなやつがね。
本当は4分とか5分とか短い短尺の動画を作るようなものなんで、長尺想定になってないですけどね、料金体系が。
ショート動画を週に1本2本ぐらい上げますよぐらいだったら多分月額課金の範囲で収まるんですけど、そういう使い方をしなかったんでめっちゃお金かかったよということです。
今回はマスボウさんと撮ったビデオポーズゲストって何分かというと2時間ぐらい喋ってるね。
それは喋りすぎだっていう話なんだけど、2時間分ちょっと映像を作りたいなと思ったときに、その同じヘドラっていうサービスを使ってやってしまうと多分5、6万かかっちゃう感じがしたので、これはまずいということですね。
今回は完全にローカルですね。私のパソコンのリソースをフルに使って、0円でちょっと動画を作れないかなということでチャレンジしてみました。
リップシンクロって、画像とか動画に対して口の部分だけを生成し直すっていうAIが出てて、それを使えば結構簡単にできるんですよ。
ただそれって基本的には静止画とかに対して口が動くとか既存の動画に対して口だけ変換するみたいなものなんで、まず喋ってるときの体の動きみたいな動画も必要なんですよね。
だからまず自分で自撮りしてこうやって、こうやってって言ってもわかんないですけど、画面を見ながらまるでカメラの前にいるかのような自撮りを12分ぐらい撮って、それをまた別の生成AIを使って、自分の体の動きを違う絵に変換するみたいな、そういうAIがあるんですよ。
それを使って、ライブポータントっていうAIがあって、それを使ってまず体の動きを作りますと、体の動きを作った後に今度その体の動きに対して口の動きを生成するって、別のAIで口の動きだけを音声に合わせて生成するということをやって、動画を作りましたと。
これが意外とうまくいって、ビデオポッドキャストのYouTubeに上がってますんで、そちらのリンク貼っておきますけど、結構うまくいきましたよ。自然にできてます。完璧ではないですけどね。20%ぐらいはだいたい映像が欠損していて口が動かないときがあるんですけど、80%ぐらいはちゃんと言葉通りに喋ってますから、喋ってる映像が撮れてますからね。
今、ローカルのAIでもこれぐらいのことできるんだなと。今回使ったライブラリに関しては結構昔から、昔って言ってもここ1年、2年前ぐらいからあるようなものなんですけど、それでもやっぱりローカルで自分のパソコンの中でこういう動画を簡単に、簡単にじゃなかったけど、生成できるっていうのは非常にいい時代になったなと思いましたね。
生成するのにかかった時間はだいたい20時間ちょっとで、だいぶヒヤヒヤしながらやってはいたんですけど、うまくいきましたよ。私は別にそんな専門的なね、Pythonは多少かけるにせよ、そこまで専門的な知識ががっつりあるわけじゃないですから、クロードコードっていうサービスを使いながら、ちょっとああでもない、こうでもないっていろいろわちゃわちゃやって、こういう方法でやりましょうみたいなことを指示しながら作ったんですけど、
本当に多分基本的な知識がなくても、そのクロードコードをある程度ちょこちょこって使えれば、多分ね、あとパソコンのPCリソースがあれば、結構皆さんもこういうことできると思うんですよ。だからなんかこれ無理だなとか、ああ、これなんかなくなっちゃったよっていう、なんか欠損したとか、そういうなんかミスをした場合、AIにどうやってリカバリすればいいかとか、これ今からでも入れる方法ありますか?じゃないですけど、リカバリできる方法っていうのを聞くって結構ね、いいと思いますね。
私の場合は、今回ビデオポッドキャストの映像撮れてなかった時点で、なんとなくこうやってリカバリできるなっていうのが頭の中であったから、すぐ行動に移したんですけど、それでもなんか、うわ、これどうしようもねっていう時でも、意外とAIはその対策を知ってるかもしれないんで、AIと一緒にですね、ちょっとミスをリカバリしていったらいいんじゃないかなというお話でございました。
マイク破損とAIでは解決できない物理的ミス
ただですね、残念ながらAIでもリカバリできないミスというものがありまして、それがですね、今まさにこの状況なんですけど、いつもとちょっとだけなんかこの声の音質というか、音が違うなって思った人、気がついた人いるかもしれないんですけど、実はですね、今外で歩きながらポッドキャスト撮ってるんですけど、使ってるマイクが違います。
今日はね、有線マイクをちょっと使っているんですけど、実はですね、今週の日曜日に、日曜日じゃない土曜日か、外で歩きながらポッドキャスト撮ろうと思ってね、ついでにランニングしようと思って外出たんですよ。
いつもね、私、Zoomの、Zoomじゃない、シェアのね、ムーブマイクっていう、結構3万円くらいするオフライン、ちっちゃいオフライン、オンラインじゃない、ワイヤレスか、ワイヤレスマイクを使っているんですけど、これがですね、ちょっと位置が決まらなくて、首元に、ちょっと夏服で久しぶりに走ってたから、ちょっと首元どこにつけようかなと思って、きめあふれてたんですよね。
ここら辺か、ここら辺かな、あ、あ、あ、あって言いながらやってたら、ポロって地面に落としてしまって、そしてですね、それがいい感じでね、地面のグレーチングにね、2度速攻ですね、ホールインワンしてしまったと。
しかもグレーチングがね、ちゃんと地面にボルトで固定されているタイプだったし、中普通にドブだから、水にポチャンって使ってですね、3万円していたマイクはですね、お釈迦になってしまいました。
このミスに関してはですね、AIではどうしようもないです。やっぱりフィジカルのミスね、健康面もそうだし、物理的な破損みたいなのは、なかなかちょっとね、AIでは対策しようがないんですよ。
対策しようがないって言ってもね、なんかね、ちょうど、それこそ、三方ポッドキャスト収録のね、伝道師である唐木先生はね、最近こう、家の水道管が壊れて、水道管というか水道関係のことが壊れてですね、それをAIで聞きましたよみたいな話をしましたけど、
そういう対策はね、ある程度できると思うんですけど、なくしたとか、なんかもう完全に落としたみたいなところは、なかなかちょっとリカバリできないんでね、ちょっと物理的なところは、AIに頼らずですね、ちょっと自分の意識で気をつけていかなければならないんじゃないかなというところでございます。
なのでちょっと今ね、代わりのマイクないんで、そうやって、以前買ったですね、有線のマイクを使って収録してるんですけど、どれくらいの音が取れるかなって感じですね。
ただね、すげえありがたいことに、マイクなくしたんで落ち込んでたんですけど、リスナーさんからDMがいただきまして、今回充電器とマイクセットになってて、マイクなくしたんだけど、マイクの中身だけ売ってるんだよ。
マイクと充電器セットで買うと3万円なんだけど、マイクの中身というか、マイク自体は1万円くらいで実は売ってて、あ、売ってるんだと思ってね。
だからね、それで実は1万円くらいでなんとかリカバリ、3万円出して買えなくても、なんかリカバリできそうな感じがしたんで、やっぱ持つべきものはね、仲間だなと、リスナーさんだなとすごく思いましたね。
ただですね、シェアのマイクってすげえ高いんですよ。高いというのは、別にマイク自体じゃなくて、オプション商法をめちゃくちゃ取っていて、今回MOOVマイクのワンっていうやつなんだけど、MOOVマイク自体は1万円で買えるんですよ。
それはそれでいいなと思ったんですけど、MOOVマイクにつける、風よけのマイクの先につけるスポンジみたいなやつあるじゃない。あれすげえちっちゃいやつがついてたけど、なんかね、つめかえパックみたいな、単体だけ買う場合って、そのウィンドブレーカーみたいなやつがついてないんですよ。
ウィンドシールドみたいなやつがね、ついてなくて、それを別で買おうと思ったら5千円するのね。ほんとただのスポンジよ。ただのスポンジなんですけど、5千円するんですよ。え、こんなスポンジマイクの半額するの?と思って。いやーでもそれないとさ、さすがにマイクとして使いようがないから、買わなきゃいけないんだけど、これめっちゃ悩んでて。
そうするとさ、今度1万5千円になっちゃうのね。マイク自体が。え、だったらなんか他のマイク買えるんじゃねえと思って。あのね、ちょっと手話ちょっとえぐいね。手話えぐいのよ。ほんとマグネットでさ、服にマイクをクリップするような、ほんとただ単純な、なんかほんとにこう、磁石ね。単の磁石だけで5千円とかするのね。
いや、これはね、ちょっときついなって思いましたね。まあ、結果的に何を買うかまだ決めあくれてはいるんですけどね。そういうふうにこう、こういうふうにリカバリできますよ。渋谷さんという情報をいただけたということがね、非常に嬉しいというお話でございました。だから皆さんもですね、ちょっと何かミスしたらですね、AIに頼るなり、人に頼るなりするのが、あの人の生き方、あのーね、生きやすい生き方だなというふうに思いましたという、ちょっとまとまりが悪いですけど。
ミスからの学びと今後の活動
歩きながら喋ってるんでね。ということでね、今回はここまでをさせていただきます。
まあね、ミスってね、まあ誰でもするものではあるんですけど、やっぱりリカバリが一番大事ですからね。今回もその録画ミスってね、前もこのカネリンが収録ミスしたときも、まあそれでカネリンを復活させるんだみたいなことをやりましたし、まあ今回は映像を作るということをやったんですけど。
まあそのためにね、自分の中にこういうことできるんだという技術的な知識が蓄積されていきますからね。
さて、ミスを技術でカバーすることによって自分を高めていくと、こういう視点を持っていくといいんじゃないかなというお話でございました。
今日はちょっとね、歩きながら時間があんまりなくて、撮れる時間が結構忙しいんですよ。バタバタね、ちょっと忙しくてね、撮れる時間がないんですけども。
また明日ね、コメント会社させていただきます。本日はここまでとさせていただきます。私は支部長技術研究所という技術部も運営しています。また、Xが毎日役立つ技術情報の発信を行っておりますので、よろしくお願いいたします。
ポトキャストものづくりのラジオの方も毎週土曜日週一で配信中です。ポトキャスト落ち着きAIラジオは毎週火曜日金曜日週二で配信中です。
だから本日ですね、落ち着きAIラジオの速報会が配信されていると思いますので、ぜひとも聞いてください。またですね、面白いXラボというリスナー向けコミュニティも運営しております。
また、LINEのオープンチャットも最近始めました。概要欄にリンク貼っておきますので、ぜひとも参加してください。また、ポイシーではプレミアムリスナーを随時募集しております。
いつもの配信ではしないようなツッコマは毎週日曜日にしておりますので、こちらも500円となっておりますけども、入っていただいて私のことを応援していただけるよという方はですね、ぜひともよろしくお願いいたします。
ウェブから入っていただくのがお得となっておりますよ。というわけで今回はここまで。以上、支部長でした。ではでは。
18:19

コメント

スクロール