1. ごりゅごcast
  2. 自動音声認識して字幕を元に動..

vrewという動画編集アプリを試してみたんだけど、これがかなりすごい!
https://vrew.voyagerx.com/ja/

今回の話題についての詳しい内容や補足リンクはこちらから確認できます。

感想や質問、リクエストなどはTwitterのハッシュタグ #ごりゅごcast にお送りください。Anchorからのボイスメッセージも受け付けています。

収録機材や収録方法、各配信の概要などはScrapboxにて詳細を公開しています。

ごりゅごcast on Scrapbox

00:00
こんにちは、ゴリゴキャストです。
今日は、Vrewっていう動画のアプリ、字幕アプリみたいなやつが面白かったので、その話をします。
Facebookで動画に簡単に字幕がつけれるアプリがあるよって書いてたのを見て、
何のアプリですかって聞いたら、そのVrewってアプリだよっていうのを教えてもらって試してみた。
Vrewっていうスペルなんだけど、
見てみたら、webベースで動くものとiOSアプリがあるみたいで、
iOSアプリの方はiPhone、iPadに対応している。
ちゃんとね、iPadにもiPad用のデザイン作ってあって、ちゃんと動いた。
最初に字幕がつけれるよっていう感じの認識で、
はるなは試してみたんだけど、
実は字幕をベースにした動画の編集がすごい簡単にできるアプリっぽいぞっていうことがわかった。
公式を見たらそういうふうにも書いてあったんだよ。
字幕が出てくるんだけど、無音っていうのはなんか点々みたいに出てきたりとか、
その点々っていう部分だけ字幕を削除すると、同時に動画も削除される。
動画の中から、まず動画をアップロードすると字幕がつきます。
だいたい時間測ってみたら、5分の動画の字幕をつけるのに1分ちょいでできた。
あれってさ、音声だけクラウドに上げてるんだよね、たぶん。
たぶんね。で、その1分の処理が終わったら、もう5分の動画全部に字幕がついてる状態で、
その字幕ベースに動画編集ができるって言ったらいいのかな。
ここの喋ってるところいらないわっていう部分あれば、そこを選んで削除っていうふうにすると、
字幕が消えるだけじゃなくて、そこを喋ってるシーンが動画も一緒に消される、カットされるっていうのかな。
俺の場合、基本的に間が長いような動画とか、だいたい見れんくって15秒飛ばしを連発して見てしまったりするタイプで、
なので自分のポッドキャストにしても何にしてもテンポ良く進められるようにしたいなって思ってるんだけど、
5分ぐらい触った感じ、すごい簡単にテンポを良くすることができる。
その余分な部分をガツガツカットしていくと、すごい簡単にカットできて、
細かい話で言うと、言葉と言葉の間の無音を認識してくれないと、そこはカットできないんだよね。
って話したら、はるなが公式サイトから無音のカット的なものも、
ウェブベースのウェブ版だとできるっぽいっていうのを今見つけてきた。
無音のカットというよりも、無音区間を何秒を無音として認識させるかみたいなやつじゃないかな。
03:06
例えばその1秒空白、音声が入ってないところがあったら、無音として点々として表示させるみたいな、そういう感じじゃないかな。
ゴリゴキャスト0.5秒を無音と判定しているっていうのが基本なので、それができたらいいね。
ただ今そのウェブベースで動く方をiPhoneでちょっと見てみようかなと思ったら、
モバイル端末にはまだ対応してません。デスクトップをご利用くださいってなってるから、パソコンとかでやらないといけないと思うけど、
ウェブベースで動くものとiOS、iPhone、iPadで動くアプリ版と2種類あって、
ちょっと触った感じ、アプリ版にはこの無音区間を設定、無音区間を短縮するみたいなのが、
項目、オプションみたいなのはちょっと見つけられなかったから、ウェブ版の方ができることは高機能なのかもしれない。
これね、今見ていてそれができるならね、動画ゴリゴキャスト毎日更新できるね。
基本的に人間だけ写して喋って、必要な部分だけ画像とか動画をちょこっと入れるっていうので、
それだったら毎日それを更新してっていうこともできるかもしれなくて、期待度は高まるね。
なんかね、iPadでそのウェブベースで動くページを見てみたら、一応はできそう。
サファリというかブラウザでならできるって感じだよね。
ただそこがそのモバイル用にちゃんと最適化されているかよくわからなくて、動かない部分とかはまだ未確認なんだけど、
今のところね、唯一のっていうか、俺のもう一つの期待が音声ファイルから字幕の精度がYouTubeの字幕より初期段階で高いんだよね。
高かったね。何にも、ノー編集の字幕バージョンをTwitterに動画サンプルとしてあげたんだけど、
本当ノー編集でもあんだけ認識してくれてる?ほとんどね、間違いなかった。固有名詞ぐらい。
さらにそのよくあるのが、YouTubeで俺が自分で見ていてよくあるのが、
そのーとかえーとかあれーとかっていう、そういう説当時設備語っていうの。
そういうのが個人的には邪魔で、邪魔っていうか、
ポッドキャストで喋っているとつい入ってしまうんだけど、
テキストにする際、字幕にする際には取り除きたい、そういう一言二言の間に入ってくるやつ。
それが消されてるんだよね。良い意味で。
無くなってるね。入ってない。
もう一番最初からえーとかあーとかっていうのは、字幕として認識されずに無くなってる状態。
06:01
入らない状態で字幕が生成される。
もし仮に例えばその動画として邪魔なら、そこが文字で認識されていれば、
その部分簡単にカットできるんだよね。
っていう意味で、理想かもしれない現状を思いつく、なんか動画プレ編集ツールなのかな。
俺が仮に使うとしたら。
その後に多分もうちょっとなんかやりたいので、欲しいとは思うんだけど、
まずそこでいらないものをカットして、書き出して、何らかの手を加えてっていうことがやれれば、
最強ツールになるかもしれない。
その普段YouTubeにあげる動画編集とかしている時は、
何回も聞きながら、ここからここまでがいらないって止めてはカットして、
カットっていうかその分割ファイルを分けて、ここまでがいらんから分割して、
その間を消してみたいなので詰めて詰めてしてるんだけど、
このアプリだと選んで削除。
で、その選ぶっていう作業が動画を見たり音声を再生しなくても選べる。
テキストベースで選べるっていうのは強いね。
なんか短時間しか試してないけど、ちょっとこれは面白そうだなって思った。
画質的なところがどうかとか、そういういろんな問題はあって、
手放しで絶対これはすごいぞってまだ断言はできないんだけど、
現状久しぶりに見つけて30分で興奮してポッドキャストでしゃべるぞっていうぐらいの勢いで、
いい感じだなって思っているアプリかな。
そういう意味では試してみてもいいんじゃないかなって思うし、
これは俺はとりあえずこの後試すわ。
ということで、今日は動画の字幕アプリと見せかけて字幕を使った編集アプリ、
VrewっていうiOSとブラウザで使えるアプリの紹介でした。
08:05

コメント

スクロール