1. ごりゅごcast
  2. 第256回:自動文字起こしや顔..
2019-05-28 08:09

第256回:自動文字起こしや顔認識モザイクなどYouTubeの投稿者向け機能がすごかった

spotify apple_podcasts

詳しくはこちら

感想や質問、リクエストなどはTwitterのハッシュタグ #ごりゅごcast にお送りください。Anchorからのボイスメッセージも受け付けています。

収録機材や収録方法、各配信の概要などはScrapboxにて詳細を公開しています。

ごりゅごcastの公開メモ

00:00
こんにちは、ゴリゴキャストです。今日はYouTubeのAIっぽい投稿者向けの機能が、なんかすごい優秀で面白かったので、それを紹介します。
Miru Podcastっていう、このゴリゴキャストの音声を使ったYouTube動画をアップロードっていうか、登録してみて、いろいろ初めて知った機能とかが多くて、
今、YouTube Studioっていう、まだベータ版だけど普通の人も使える編集機能?
YouTubeに動画を登録した後、いろいろ管理する。その説明文を入れたりとか、カテゴリーを決めたりとかっていうことをやるページなんだけど、
そこに使ってみて、こんななんか便利になってるんだって思うのが割と結構たくさんあって、最初に驚いたのが字幕。
字幕っていうか、動画内の音声を認識してテキスト化してくれるっていう機能なんだけど、
このゴリゴキャストで喋ったやつをボタン1個って言ったらいいのかな? 音声、自動、日本語みたいに設定してやると、なんか勝手に字幕作ってくれて、
これがね、だいぶ精度高いんだよね。少なくとも、なんて言うんだろう、
ポッドキャストをそのまま文字化しようと思ったら、まず1回YouTubeに登録して、
さらにそこからテキストファイル、厳密にはテキストファイル、拡張者は違うんだけど、テキストファイルのダウンロードもできるので、
それをダウンロードして編集するのが一番文字起こしとして賢い方法なんじゃないかって思えるレベルで、すごい優秀で、
多分ね、喋ったやつを文字起こししようって考えると、今のところ音声認識でもう1回喋ったらいいんじゃない?っていうことを最初は思ってたんだけど、
そんなことをするより、動画にしてYouTubeに非公開動画にして投稿してしまって、字幕ファイルを落とすっていうことをやったら最強に賢そう。
さらにその字幕を元にYouTubeスタジオっていうか、YouTubeの管理画面から字幕を編集するっていうのができて、
それがね、動画を聞きながらでリアルタイムに時間が流れるとテキストが移動してくれるっていう感じで映っていくからめっちゃやりやすいんや。
で、その編集を済ませてからダウンロードしてしまえばすごく便利だし、投稿者が言語を設定してくれれば、英語とか外国語の動画もすっごいなんか実用レベルでもう読めるっていうか聞ける見れるようになってきている感じがした。
あれ結構すごいよね。なんかiPadのアプリのチュートリアル動画みたいなのを割と見てて、
最近特にあの動画編集に使ってるルマフュージョンっていうiPadアプリのその使い方みたいなのを見てるんだけど、
03:04
まあ日本語のコンテンツはなくて、全員英語で喋ってる人たちばっかりで、
なんとなく操作画面を見てればわかるっちゃわかるんやけど、その説明、口で説明してることも理解したくて、動画のオプションで字幕を選んで自動翻訳とかにしとくと、
日本語で翻訳されたやつが表示されて、ああまあこういうこと言ってるのねみたいなのがわかる。
翻訳もだいぶ賢い。賢い。まあそっちは見る側だから見る側の機能ではあるけど、でも外国語の動画も割とくもなく意味を理解すればできるようになってきてるんだよね。
なんかウェブのページとかだとグーグル翻訳とかで知りたいとこだけコピペしたりとか、
ページ翻訳っていうのかな?あのウェブページ全体を翻訳するあれで開いて翻訳するっていうことをしてるんやけど、
youtubeのほうが簡単っていうかお手軽。で実際自分の動画にもあの吹き替えというか字幕設定オンにしてみたら、
言ってたみたいにまあまあ割とちゃんと入ってて、あこれならなんか結構実用レベルかなって。
日本語コンテンツが確率は低いけど外国人に見てもらえる可能性もあるしね。
その機能自体はなんかこう、理論的にはもう今時できるよねっていうことは思ってはいたんだけど、
それが誰でも使えるレベルの機能で標準として備わってるっていうのがやっぱすごいなーって感じで。
もう一個すごかったのが動画のモザイク入れ。それも同じく基本的に自動でできるっていうのが、
その機能自体もまあできそうなんだけど、それがyoutubeで簡単にできるっていうのがすごいと思って。
なんかね、モザイクを入れるってやると処理中でまあその間は待たされるんだけど他事しとくか、処理が終わるとなんかね動画の始めから順番に出てくる顔っぽいものがバーってリストアップされるんだよね。
で、この顔にモザイク、チェックを入れてこの顔にモザイクっていうボタンを押してやると動画内のその顔に適切にモザイクをかけてくれる。
で、例えばその人が動いたとき追従してモザイクも動くんだよね。
うん、ちゃんと認識できてるからね。これは人でこの人だっていう認識ができてるから。
なんか一部Tシャツの柄っていうか洋服の柄のとこにも顔判定されて若干モザイクがかかってたりとかしたけど、その辺は自分の選択次第ではあれってことかな?
うん、まあただね数が多いとね、その範囲設定する数がめちゃくちゃ多くなるのと、完全100%じゃなくて少なくとも自分が試した限りで漏れてるやつとかはあったから
06:03
手間をゼロにできるわけではないんだけど、現状で多分下手に動画編集アプリとかでやるより、もうYouTubeでやった方が完全に便利。
それ自動認識で認識されなかった顔とかにここにモザイクをかけたいっていうのは手動でもできる?
うん、自動の後にオブジェクトを範囲指定するっていうイメージで、そのここっていうのを設定してやると、なんとなく多分これっていうのを範囲で選んでくれるから、
それもまあ言ったら直感的にこの動画に出てくるこの部分をモザイクかけたいわ、顔じゃなくてもちゃんと試してないけど多分このテキストみたいなのもオブジェクトとして認識できれば、それを動画内で消してくれるとかもできるはず。
動画の編集、そのカットしたり長さを変えたり効果を入れたりも、そのYouTubeスタジオの編集画面、動画編集画面でできちゃうから、なんか動画編集ソフトを使ってるような感覚でできたよね。
まあ言うて、あのウェブでブラウザで操作するので、はっきり言ってこうガッツリいろんなことをやるんだったらちゃんとソフトを使った方がいいのは明らかなんだけど、
割といろんなことが思っていた以上にできて、しかもそれが思っていたよりすごい。これは驚きだったし面白かったね。
まあ今までYouTube動画をアップしたことはあったけど、すっごい昔で、しかもなんか共有メニューから直接YouTubeに上げるみたいな、そういうのでしかやってなかったから、
YouTube、今のYouTubeって結構いろんなことができるように作られているんだなっていうのは感じた。
まあそりゃいっぱい投稿する人も増えるわっていうのも思った。ということで、YouTubeの投稿者向けの機能、AI系機能って雑な日本語を使ってるんですが、
そういう自動認識系のものがすごい賢くて便利だったっていうお話でした。
08:09

コメント

スクロール