1. ふとんの中で聴くラジオ🛌
  2. 文字起こしAIのWhisper AIを使..
2023-10-20 15:47

文字起こしAIのWhisper AIを使ってみた感想

YouTubeで見る👉 ⁠⁠https://youtu.be/RuWMgxNDZpE⁠⁠ ■Whisper AI ・精度がGoogleドキュメントの音声入力より劣っている印象 ・タイムコード(タイムスタンプ?)も出力できるので字幕ファイルとして使えそう ■Vrew ⁠⁠https://vrew.voyagerx.com/ja/payment/pricepolicy⁠⁠ ・有料だけど性能良くて割と安価 ・8600円/年 ・1200分/月 文字起こし可能 ■Google Speech to Text ⁠⁠https://cloud.google.com/speech-to-text/pricing⁠⁠ ・Googleの文字起こしなので精度はまあまあ? ・$0.024 / 分 ・1ドル115円として1200分で3312円なのでVrewの方が安い ■Amazon Transcribe ⁠⁠https://aws.amazon.com/jp/transcribe/pricing/?nc=sn&loc=3⁠⁠ ・Amazonの文字起こしなので精度はまあまあ? ・字幕ファイルで出力できるらしい ・こちらもGoogleと同じく$0.024 / 分 1ドル115円として1200分で3312円なのでVrewの方が安い

サマリー

Whisper AIを使用してみた感想を話します。精度はちょっと微妙かもしれませんが、タイムコードが全部表示されるため、字幕ファイルに使えると思いました。Whisper AIの使用感はまあまあですが、Googleドキュメントの音声入力と比べると劣ります。しかし、字幕としての使用には適しており、無料で利用できるため、動画編集に活用したい方にはおすすめです。

Whisper AIの精度とタイムコード
Whisper AI、文字起こしのAIサービスを使ってみた感想を話してみます。
ズバリですね、ちょっと精度が微妙かもしれないなーっていうのと、でもタイムコードが全部出てきてくれるんで、
字幕ファイルにはなりそうなんで、できたら使いたいと思いましたね。
ちょっと曖昧な話ですいませんが、そんな感じです。
僕はフリーランスで3年間フリーランスやってる37歳のおっさんです。音声配信は4年間やってます。
今日も聞いてもらってありがとうございます。 音声配信やってると、文字起こしをしたいんですよ。
なぜかというと、なるべくいろんな人に届けたいので、テキストでブログにして書いたりとか、
これ今音声喋ってて、ポッドキャストとか配信してるんですけど、実はYouTubeにも流してて、YouTube上ではテキストのフルテロップで流してるんで、
そっちのプロフィールから飛んでもらったら一応そっちもあるんで見てもらったら嬉しいですけど、
ただとはいえ、フルテロップも完全なフルテロップじゃないというか、精度がそこまで完全じゃないのと、
一文字一文字出てくるタイプのフルテロップなんで、ひょっとしたらちょっと見づらいかもしれないんで、
できたら字幕をね、よくYouTubeであるような感じで出したいんですよ。パンパンと一文ずつパンパンと出したいんですよね。
一文ずつね、一文字ずつじゃなくて、だからなんとかね、テキストを文字起こしをしたいって思ってるんですよね。
同じような気持ちの人多いと思うんですよね。ちょっとコミュニティで色々喋ったりしてたんですけど、やっぱり文字起こしどれがいいんかなーとね、
みんな悩んでるんですよね。今日冒頭に言ったWisper AI、これがChatGPTのメーカーさんのAI機能です。
オープンAIのっていうメーカーさんのAI機能で、実は無料で使えるんですよ。
Googleコラボで無料で使えるんですね。
なんと無料で使えるんで、ちょっと使ってみたんですよ。わからないプログラムを一生懸命打ち込みながら頑張ったんですけど。
使ってみた結果、ちょっと精度が落ちてるなと思いました。何に比べてかっていうと、例えばGoogleドキュメントとか、あとは文字起こしサービスで有名なBlueで比べたときにちょっと落ちるかなと。
これYouTubeで見てもらったら画面も有りなんで、よかったらYouTubeでも見てもらったら嬉しいです。
画面上で収益化プログラムっていうのを喋ってるんですけど、
収益化プログラムって言って喋ってるんですけど、収益が集める、って書いてて、僕の滑舌もあんま良くないからなんですけどね。
収益機関が蒸気機関の機関になってて、熱機関とかそういう収益化プログラムがうまく文字起こしされてできてないんですよね。
あとは、スタンドFMが、スタンD、スタンDFM、これ僕の滑舌が悪いかもなんですけど、もしかしたら僕の滑舌が悪いせいかもしれないんですけど、
とはいえ、ちょっと精度がうーんっていうのと、
ただここにタイムコードが全部記録されてるんですね。何秒の間にこの文字を喋りましたっていうのが記録されてるんで、
字幕ファイルとしてアウトプットできるはずなんですよね。
文字起こしのニーズ
その字幕ファイルとしてアウトプットできたら何がいいかっていうと、
動画編集の時にこの字幕ファイルをオリャって流し込んだら、バチッとテロップにタイミングが合うんですよね。
この喋ってる声のタイミングに合わせてテロップが出るようになるんですよ。
なぜならこのタイムコード、何秒で何々を喋ってるっていうのがあるんでね。
だから、これがあるのはめちゃめちゃいいなと思いました。
だからできたら使いたいんですけど、使いたいんですけどっていう感じです。
もうちょっと精度が良ければなーっていうのと、ちょっと一文が長めかなーっていう、
これをそのままバチッとテロップ入れちゃうと多分横幅何文字いっちゃうねんって話になるんでね。
理想は20何文字ぐらいってあるんで、だからもっと少ないぐらいでもいいぐらいなんでね。
というのが、ウィスパーAI、チャットGPTのメーカーさんのウィスパーAIっていうのを使ってみた感想です。
まあちょっといろいろね、もう1回プログラム入れたら、あと次何回でも使えるんですけど、まあでも使うかどうかなーっていう感じですね。
なんか2分ぐらいでちょっとあれも終わっちゃったんでね、何だっけ、文字起こしも終わっちゃったんで、どうかなっていう感じで。
他の文字起こしサービスの比較
で、ここから他の文字起こしサービスどうかなっていうのを改めて振り返ってみました。
っていうのもいろいろあるんですよね。
有料のサービスが結構あるんで、どれが自分だったらどれ使うかなっていうのを3つぐらい出してみました。
1個目が3つあって、1つがブルー、もともと無料だったんですけど、この4月かな、2023年4月から有料になったサービス。
2つ目がGoogleのサービスでスピーチトゥーテキスト、スピーチはシャベルのスピーチでトゥーテキストでテキストにするよっていうスピーチトゥーテキストっていうサービス。
3つ目がAmazonの文字起こしサービスで、これトランスクリプトランスクライブってAmazonの文字起こしサービス。
料金が3つとも結構安めなんですよね。
一番安いのが、料金、単価がちょっと違うんですけど、一番安いと思われるのが、ブルーのこのライトプランっていうので年間8600円。
1ヶ月あたり1200分文字起こしできます。
これがおそらく一番安くて、1200分足らないって人はもうちょっとあれなんですけど、これなら安いかなと思います。
ブルーはやっぱり精度が結構だいぶ上がってるんで、だから僕はできたらこれ使いたいなと、ちょっと心がだいぶ動いてます。
そしてブルーはさっき言ったような字幕ファイルでの出力もできちゃうんですよね。
それはどういうことかというと、プレミアプロの動画編集に流し込んでバチッとテロップのタイミングを合わせられるっていう。
ブルーの中でやってもいいんですけど、微調整するならプレミアの方でやった方がやりやすいんで、それもできるんでね。
ブルーは年間8600円で、月716円程度なんで、本当にショート動画とかを本気でやりたいとかね。
音声だけじゃなくてショート動画にもサクサクっとテロップ乗っけたいって僕は思ってるんで、ブルー使おうかなっていう気がすごい今湧いてます。
ここで目標みたいな。
すいません、ちょっと娘が学校閉鎖で急遽帰ってきた娘と喋ってました。すいません。
だからブルーをできたらね、多分これが一番安いかなと僕の中で思ってます。
で、次に安いのが、一緒なんですけどね。GoogleのスピーチトゥーテキストとAmazonのトランスクライブ。
こっちがね、ちょっと料金形態がわかりにくいんですけど、ドルなんですよね、ドル。アメリカドル。
えっとね、0.1、どれだったかな。1分あたり、あったあった。1分あたり0.24ドル。
うん、わからない。わからないんですけど、わからないんですけど、計算してみたところどうもだいたい1200分でね、ブルーの1200分で換算したら3000円超えるぐらいやったんですよね。
間違ってた、すいません。1分0.024ドルやから、結構でも計算間違ったかな。60倍してさらにそれを1時間やから。
ちょっと間違ってるかもしれないですけど、あれ?こんな料金形態やったかな。1秒やった気がするんやけどな。ちょっと変わってますね。
ちょっと待ってくださいね、計算しよう。はい、ちょっと計算をし直したんですけど、やっぱあってましたね。
0.24ドルで、ドルなんで安く見えてたんですけど、円換算すると、えっとね、月付きが1200、1200分の時3312円やったかな。
3312円になる感じなんですよ。0.24ドル円、1分あたりやと。
なんでこれね えっとあれえっとブルーねブルーの方は年間8600円なんでしかも1ヶ月716円
単価なんでそれやったらもうブルーでいいかなーという気もしますよね1200分まで ったかねはい
で同じでグーグルなんで精度は結構やっぱりいいと思います あのあれグーグルドキュメントの制度なんでほんで
今これにちょっと youtube の方で見てもらっている人はこの字幕出てるのもこれ スピーチ2テキストのサービスをね
使ってるのを活用させてもらってるんでまあまあ精度いいんじゃないかなと思います 滑舌さえ良ければあと
あの喋る速度をそれなりにちょっと遅めにすればゆっくりしゃべればまあまあ 精度はよく文字起こししてくれてるなという印象です
で最後3つ目のアマゾンこれもまあえっとね料金がね一緒です確かね一緒っていうのは グーグルの方と一緒ですねこれも0.024ドル1分あたり
なんでまあ1200分でだいぶ何倍った3312円 のはずです
ただこっちのアマゾンのいいところはねどっかで見たんですけどすいませんどっかで どっかでまとめ記事あったら見たんですけどあの字幕ファイルで出力もできるっていう
僕が一番を望んでるタイプなんですよね 要はタイムコード何分何秒でこういう文字をしゃべったというのが出てくるらしいんで
それ使いたいなって思ったんですけどただ料金的にも結局はブルーの方安いんですよ ね1200分で
1ヶ月ね1200分でまあ年間払いですけど月々716円のブルーが結局 安いんかと思ってちょっと心がだいぶ動いてますね
でしかもは動画編集もカットとかねでもうもうっていうのは音がないところも検索 えっと検索っていうか抽出かしてそこをカットとかにしやすいらしいんでもう
プレミアフォローも使わねえちゃうかなっていう気もしてますほんまに だからね
だいぶ心動いてますね来年はもしかしたずっとブルー使ってるかもしれないはい っていう今日はね話でしたちょっとまとめますと
ウィスパーAIの使用感想
まずは a ウィスパー ai を使ってみました
あのオープン ai チャット gpt のメーカーメーカーっていうのかなの会社が作った a
sb スパイア使ってみた結果 まあ制度はぼちぼちあったなとまぁちょっと正直 google
ドキュメントとかの音声入力に比べたらちょっと見劣りしているかなっていう印象でした ただ
字幕として何分何秒にこれしゃべったっていうのが出てくるんで まあ結構動画編集に使いたい人はありなんじゃないかなと思いました
しかも無料なんでねはい やけどまぁちょっとって感じですね制度がどうしてもってちゃん日本語対応もしています
もちろんさっきのねこれまで全部日本語対応してますんでねはい でじゃあ代わりにどんなサービス使いたいかっていうのを3つ
自分の中で挙げた結果は分流と google のスピーチ2テキストと amazon トラ
amazon トランスクライブ3つがいいかなと 料金で言うと一番安いのはブルーやし精度も正直分量も結構いいと
なんでブルー結構使いたいなとなっています年間で8600円で月々716円換算です 使いたい今1ヶ月あたり1200分
館への文字起こしできます google のスピーチ2テキストと amazon の amazon トランスクライブは
ドルです1分あたり0.224ドル円なんで 0.024ドルでいいお菓子0.024ドルなんで
1200分で円換算したら33121ドル115円で計算しています 3312円1200分のはず
amazon も一緒ですで amazon の方はまあ字幕ファイルで出るらしいんですけど結局 料金的に見ても機能的に見てもブルーを契約したいなという気持ちになっているという
またそんな状況です契約したらまたね こんな感じの使用感ですってね放送できたらいいなと思いますはいということで今日の放送
終わります いやーね
文字起こし問題はこれはねもうずっとつきまとうと思いますし フルテロップにで入れることでやっぱ衝動動画にね
テロップ入れて流すというのも当たり前になってるんでどっちかというとそっちゃと思うん ですよね
長めの動画でも使っ使うのもいいんですけどショート動画で出すってなった毎日まあ 更新するますよね毎日とは言わんかもしれないんですけどだからポンポンポンポンで出せる
ようにしたいと思ったら結構やっぱランニングコスト下げたいし でもやっぱ機能は欲しいし機能は充実して欲しいしということでね
いやー悩ましいんですけどねまたねその辺 まあ大端にお話しできることがあればねここからこのねチャンネルでどんどんしゃべっていきますんで
よかったらですねそこのフォローだそこのフォローバターが応援のボタンになってますんで よかったらポチッと忘れないうちにポチッとしてもらえるとすごく嬉しいです励みになります
はいということで今日の放送終わりますよかったらですね チャンネル登録と高評価ボタンを押してもらうとそっちも応援のボタンになってるんで嬉しいです
はい音声で聞いてもらっている方は概要欄に この youtube チャンネルのリンクも貼っておきますし今日紹介したね
ブルーとグーグルのスピーチ2テキストと amazon のトランスクライブもね リンク貼っておきますんでね
ぜひやってみたいなーって人はちょっと見てみてくださいということで今日の放送あります 最後まで聞いてもらってありがとうございました次回もよかったら聞いてもらえたら嬉しいです
それではまた
15:47

コメント

スクロール