WEBVTT

00:00:00.020 --> 00:00:05.120
AIの文字起こしツール、いろいろあって、結局どれがいいんだって迷っていませんでしょうか。

00:00:05.120 --> 00:00:14.220
で、今使ってるんだけど、毎回こう結構手直しが多くて、まあでも使わないよりはいいかーって感じで、諦めてたり惰性で使ってたりしないでしょうか。

00:00:14.220 --> 00:00:18.540
今回はそんなですね、モヤモヤを解消する動画にしたいと思います。

00:00:18.540 --> 00:00:21.200
こんにちは、スモールビジネス特化の学び舎、このは屋です。

00:00:21.200 --> 00:00:26.380
さて、先ほどのAIの文字起こしツールについてなんですけども、結論を先に言います。

00:00:26.380 --> 00:00:32.200
無料で高品質の文字起こしを求めるのならば、ジェミニー一択です。

00:00:32.200 --> 00:00:48.440
なぜそのように断言できるのか、今回はAIの文字起こしツールを選ぶときに重要となる3つの基準、3つの視点と、その他ジェミニー以外の、例えばグラディアとかノッタとかAIノート、旧クローバノート、こういったものと比較しながらですね、ご説明したいと思います。

00:00:48.440 --> 00:00:54.500
先に3つ、3つの基準何かというとですね、まず日本語の文字起こしの制度です。

00:00:54.500 --> 00:00:57.660
これが悪くては話になりません。仕事に使えませんよね。

00:00:57.660 --> 00:01:02.180
そして無料で使えるのかどうかです。ここも大きな今回の動画のポイントになりますよね。

00:01:02.180 --> 00:01:07.440
あんまり無料だと制限がありすぎて結局課金しなきゃいけないってなると、あんま試せないので無料で使えるか。

00:01:07.440 --> 00:01:14.280
そして3つ目っていうのが動画とか音声、URL、様々なファイル形式に対応しているかということになります。

00:01:14.280 --> 00:01:19.520
この3つを基準に比較をしてですね、その上でジェミニーなんだよってことでお伝えします。

00:01:19.520 --> 00:01:27.200
そしてこの動画の後半ではジェミニーを使って、さらに100点だとしたら120点取るような文字起こしを引っ張ってくれる、

00:01:27.200 --> 00:01:32.500
文字起こしをしてくれる、吐き出してくれるようなプロンプトもご紹介しようと思うので最後までご覧ください。

00:01:32.500 --> 00:01:40.120
ではここからはパソコンの画面に一緒に行ってですね、ジェミニー、グラディア、ノッタ、AIノート、このツールたちを比較します。

00:01:40.120 --> 00:01:44.760
比較する基準は品質、価格、ファイル形態、これでやっていきたいと思います。

00:01:44.760 --> 00:01:51.520
じゃあ一緒に行ってみましょう。

00:01:51.520 --> 00:01:56.680
はい、ではこんな感じでパソコン画面に行きました。こちらがグラディアというツール、そしてこれがノッタというツール、

00:01:56.680 --> 00:02:03.340
そしてこれクローバノート、旧クローバノートですね。今はこれ使えなくてAIノートというLINEが運営しているAIノートというものですね。

00:02:03.340 --> 00:02:05.340
はい、クローバノートはこれ消しちゃいますね。

00:02:05.340 --> 00:02:10.000
はい、で、ジェミニー。ジェミニーはGoogle AI Studio経由でのジェミニーになってますのでご注意ください。

00:02:10.000 --> 00:02:17.360
こちらであれば無料で使えますので。基本これ今回紹介するのは無料ということですので、無料のAIツール、文字起こしツールになっています。

00:02:17.360 --> 00:02:24.760
ただ、利用制限があったりだとか無料だと使える範囲が狭いものについてもお伝えしていきますので、それも基準として選んでみてください。

00:02:24.760 --> 00:02:32.880
もう結論は出てますからね。結論はジェミニーを使っていただければいいんですけど、どういう点で比較していくかということを見ていただければなというふうに思いますね。

00:02:32.880 --> 00:02:39.040
はい、で、最初なんですけどやっぱり品質ですよね。品質をそれぞれ見ていこうかなというふうに思います。

00:02:39.040 --> 00:02:43.400
はい、ではまず日本語の文字起こしの精度から大事なところですね、見ていこうと思うんですけど、

00:02:43.400 --> 00:02:49.120
これがグラディアで3分以下2分40秒ぐらいの音声コンテンツを読み込ませたものになります。

00:02:49.120 --> 00:02:58.040
まあ悪くないんですけど、僕個人的にグランディアを使ってた時、結構手直し、人間が手直しする回数は多かったなと思います、その他のツールに比べて。

00:02:58.040 --> 00:03:04.840
なので、精度的には他のツールと比べてもちょっとだけ劣ってしまうかなというのが現状ですね。

00:03:04.840 --> 00:03:12.640
はい、この辺とかざっと見てもらえればわかるんですけど、今回はオンラインイベントを使った営業を売り込まずに売れる場所を作ろうというテーマで解説します。

00:03:12.640 --> 00:03:32.120
みたいな感じで、文字の区切り区切り、当店の場所とか文脈的な区切りが少し不自然になってしまって、こういったところ手直しとか漢字の変換ミスみたいなものが所々あったりして、ちょっと手直しが多かったなという印象なんで、精度だとちょっとグラディアがちょっと劣ってしまうかなという印象ですね。

00:03:32.120 --> 00:03:38.600
続いてノッタを見ていこうと思うんですけど、ノッタね、グラディアと比べると品質すごい良いですよね。

00:03:38.600 --> 00:03:49.600
この辺とかワーシャで時間でタイムスタンプみたいな感じで区切ってくれてて、見てみると漢字の変換とかこの当店の入るタイミングなんかもですね、もうほぼ完璧ですね。

00:03:49.600 --> 00:03:52.800
なんでノッタ、やっぱ精度良いですね。

00:03:52.800 --> 00:04:01.120
結構ノッタがこの文字起こし界隈だと有名というかですね、なんかちょっと前に話題になってたんで、さすがノッタだなというふうに思います。

00:04:01.120 --> 00:04:04.080
はい、精度を求めるならば全然良いですね。

00:04:04.080 --> 00:04:11.160
はい、その他の評価基準のところでちょっと引っかかってきてしまうんですけど、精度ではノッタは悪くないかなと思います。

00:04:11.160 --> 00:04:17.320
旧クローバノート、現AIノートという撮影地点ではこういう名前なんですけど、LINEが運営しているやつですね。

00:04:17.320 --> 00:04:25.800
これもノッタぐらいですね、ノッタぐらい、ノッタぐらいの文字起こし精度でほぼほぼ漢字の誤変換もほぼないですし、

00:04:25.800 --> 00:04:36.200
不当点の区切り方も大丈夫ですね。これは読み込ませてる音声が短いので、ミスというかそういったものが少なくなるっていうのはあるんですけど、完璧かなと思います。

00:04:36.200 --> 00:04:43.160
で、最後ジェミニーですね。Google AI Studioのジェミニーということで、これもほぼ完璧です。やっぱね、良いですよね。

00:04:43.160 --> 00:04:50.520
なので、やっぱりこれ読んでもらえば分かるんですけど、画面止めてね、読んでもらえば分かるんですけど、良いんです。良いしかない。

00:04:50.920 --> 00:05:01.560
ほぼ完璧です。ほぼ完璧。何が言いたいかというと、品質を言うと、実はノッタ、AIノート、ジェミニーほぼ変わらないんですね。ほぼ変わらない。

00:05:01.560 --> 00:05:08.920
まあその収録内容によってちょっと変わるかもしれないんですけど、ほぼ文字起こし精度はノッタ、AIノート、ジェミニーは変わらないです。

00:05:08.920 --> 00:05:15.320
どれを使っていただいてもそんなに不便するってことはないと思います。これが文字起こしの精度っていうところですね。

00:05:15.320 --> 00:05:22.200
次なんですけど、価格ですね。価格。無料で使えるのかっていうところですよ。ずっと無料で使えるのかってことなんですけど、

00:05:22.200 --> 00:05:28.680
グラディアンに関しては、月10時間だったかな、撮影時点では。月10時間までは無料で行けるっぽいので、

00:05:28.680 --> 00:05:35.160
それ以下であれば使えるかなと思うんですけど、さっき言った通り、品質のところでちょっと引っかかってきちゃうので、

00:05:35.160 --> 00:05:41.640
まあ第一群っていうかね、メインで使うのはちょっと心もとないかなというふうに思いました。

00:05:41.720 --> 00:05:47.080
はい、正直なところね。次ノッタですね、料金ですね。これね問題なんですよね。

00:05:47.080 --> 00:05:53.960
やっぱりガッツリ課金していかないと本格的には使えません。この一つの音声のファイル自体もですね、

00:05:53.960 --> 00:06:00.040
これなんで今回2分40秒のやつにしたかというと、実は3分以上のファイルがアップロードできないんです、ノッタ。

00:06:00.040 --> 00:06:07.720
動画にしろ音声にしろ、3分超えちゃうとダメなんですよね、文字起こしが。だから結局課金をしなければいけないってことになってしまうので、

00:06:07.720 --> 00:06:15.880
今回の趣旨である無料で使えるというところで言うと弾かれてしまうのかなと。3分以内の音声コンテンツしかできないっていうところになっちゃいますからね。

00:06:15.880 --> 00:06:24.360
はい、その辺がねちょっと不便かなというところです。ただノッタいいところもあって、Zoomと連携できたり、このGoogleカレンダーと連携するとかって上にありますけど、

00:06:24.360 --> 00:06:32.120
もっとZoomをガンガン使ってミーティングとかをしているとか方は、Zoomと連携をして議事録みたいなものもね、

00:06:32.120 --> 00:06:38.680
録っていってくれるので、そういうふうな使い方をする場合は、ノッタでZoom連携してっていう使い方がおすすめです。

00:06:38.680 --> 00:06:49.880
連携機能がノッタ豊富っていうのはね、魅力ですね。ただ文字起こしの精度はいいし、そういった機能も充実してるんだけど、料金の面ですね、引っかかってきてしまったというところになります。

00:06:49.880 --> 00:06:57.080
無料で使うのはちょっと厳しいかなと思います。続いてAIノートなんですけども、これね、先ほどお伝えした通り品質はいいですよね、文字起こし精度はいい。

00:06:57.080 --> 00:07:04.440
料金なんですけど、月に300分、これ撮影時点では月に300分までいけるんで、まあいいんじゃないでしょうかっていうところですね。

00:07:04.440 --> 00:07:08.920
まあ使えるんじゃないかなという範疇ですかね。これ無料で使えると言ってもいいのかなと思います。

00:07:08.920 --> 00:07:18.280
で、品質もいいと。で、なんでじゃあジェミニーに勝てないんだっていうところですね。ジェミニーになんで勝てないかっていうと、実はこれね、AIノートこうやって作りましょうっていう時に、

00:07:18.280 --> 00:07:25.560
これトップページに行くんですけど、まあこんな感じでトップページに行くと、こっからね、ファイルをアップロードして文字起こししますっていうフローに入るんですが、

00:07:25.560 --> 00:07:33.560
これよく見るとですね、ファイルの最長が60分以内にしてくださいね、60分超えるものはアップロードできないっていう制限がある。

00:07:33.560 --> 00:07:41.560
そして対応してるのがM4aとMP3、AACっていう風に音声だけなんですよね。音声だけなんですよ。

00:07:41.560 --> 00:07:48.600
だから動画ファイルをアップロードしたりだとか、URLからアップロードしたりみたいなことができないんですよ。

00:07:48.600 --> 00:07:54.920
例えばYouTubeのURLとかをアップロードするみたいなのができないんでね。ここがね、ネックになってくるかなというところですね。

00:07:54.920 --> 00:07:58.120
なので価格に関してはいいでしょうというところですね。

00:07:58.120 --> 00:08:06.920
で、Geminiですね。これは、このGoogle AI Studio経由であればずっと制限なく無料で使えます。撮影時点ではね。

00:08:06.920 --> 00:08:16.920
今の時点では使えるので、無料でずっと使えるっていうと、これに敵うものはないかなということで、Geminiが価格の面でも優勝というかね、1位ということになります。

00:08:16.920 --> 00:08:20.120
AI Studio経由であれば使えるということですね。

00:08:20.120 --> 00:08:27.120
3つ目の評価基準ということで、またGladiaに戻りたいと思うんですけども、アップロードできるファイル形式ですね。

00:08:27.120 --> 00:08:33.120
さっきちょっとLINEのAIノートのところで音声ファイルしかアップロードできませんって話をしちゃったんですけど、Gladiaはどうかというとですね、

00:08:33.120 --> 00:08:39.120
GladiaはここにペーストビデオリンクってことでURLから文字起こしもできます。

00:08:39.120 --> 00:08:47.120
アップロードファイルっていうことで音声と動画、こういったところから文字起こしができるんで、幅広く対応してますよね、Gladiaはね。

00:08:47.120 --> 00:08:52.120
リアルタイムで喋って文字起こしすることもできるということで、ファイルの対応形式はOKですね。

00:08:52.120 --> 00:09:00.120
ただGladiaは精度の面でね、若干他と比べて劣ってしまうので、ちょっと惜しいなというところです。

00:09:00.120 --> 00:09:09.120
続いてNotaですね。Notaはさっきの時間制限ですよね。3分以上のコンテンツアップロードできないとかということで、無料プランでは使うのが限られてしまうというところなんですけども、

00:09:09.120 --> 00:09:15.120
アップロードできる形式に関してはですね、ちょっとトップページ、ホームに行ってみますね。

00:09:15.120 --> 00:09:20.120
Notaの場合、ここからアップロードで音声と動画両方アップロードすることができます。

00:09:20.120 --> 00:09:24.120
録音開始でリアルタイム音声を文字起こしすることもできます。

00:09:24.120 --> 00:09:33.120
ただURLを読み込ませて文字起こしっていうのはこの場面ではないので、ちょっとそれはできないのかなというのが現時点で画面を見て思うことですね。

00:09:33.120 --> 00:09:37.120
実際その機能が書いてなかったんでURLは難しいかなと思います。

00:09:37.120 --> 00:09:50.120
続いてAiNoteなんですけども、さっき言った通りこちらはですね、残念ながら音声のファイルだけが文字起こしできますので、動画とかURLから持ってくるっていうのはちょっと難しいということになりますよね。

00:09:50.120 --> 00:10:01.120
そしてGeminiですね。こちらAiStudioのGeminiはなんとURLで、例えばYouTubeの動画をこちらにアップロードしてこれを文字起こししてってすれば文字起こしをすることができます。

00:10:02.120 --> 00:10:11.120
なので動画、音声、URLっていうところにすべてに対応しているということで、この点でも1位なんですよねやっぱり。

00:10:11.120 --> 00:10:17.120
ということでいかがでしたでしょうか。結論Geminiということでした。

00:10:17.120 --> 00:10:25.120
比較基準としては日本語の文字起こしの性能、そして無料で使えるのか、そしてファイル形式ということでしたね。

00:10:25.120 --> 00:10:28.120
やっぱりこれ比較するとGeminiでしょ。

00:10:28.120 --> 00:10:39.120
しかもGeminiのいいところはさらにあってですね、だいたいスモールビジネスとか私たちがサポートしている個人の企業か小さな会社さんっていうのはただ文字起こしするだけじゃないんですよね。

00:10:39.120 --> 00:10:45.120
文字起こししてそれをブログにしたりメルマガにしたり違うコンテンツに再利用したりするってことがあるわけです。

00:10:45.120 --> 00:10:51.120
その時にGeminiで文字起こしをやっちゃえばそのままブログ書いてってプロンプトを打ったりだとか、

00:10:51.120 --> 00:11:02.120
これをこういう議事録としてまとめたいからレポートにしてみたいな感じで指示をそのままGeminiでシミレスにやっちゃえば成果物も出来上がってくるので業務フロー的にもGeminiおすすめかなと思います。

00:11:02.120 --> 00:11:14.120
そしてこの動画の冒頭に言っていたさらにGeminiの文字起こし制度を120点にするプロンプトをご紹介しますということでお伝えしていた通りちょっとそのプロンプトをご紹介したいと思います。

00:11:14.120 --> 00:11:16.120
またちょっとパソコン画面に行きますね。

00:11:16.120 --> 00:11:22.120
はいこちらさっきの画面なんですけどもこの音声の文字起こしをお願いする時にこういうプロンプトを打ってみてください。

00:11:22.120 --> 00:11:25.120
アップロードした音声ファイルを正確に文字起こししてください。

00:11:25.120 --> 00:11:28.120
このプラスマークから音声をアップすればいいですよね。

00:11:28.120 --> 00:11:30.120
これを付け足してほしいんですよ。

00:11:30.120 --> 00:11:39.120
なお音声の内容はこの早がスモールビジネスのマーケティング主砲としてオンラインイベント、勉強会、体験会、ワークショップなどを推奨している内容ですという補足を入れておいてあげてください。

00:11:39.120 --> 00:11:48.120
この補足を入れることでこれはスモールビジネスのマーケティングについて話していて勉強会、体験会、ワークショップについて話しているんだなみたいな文脈を与えることができるんです。

00:11:48.120 --> 00:11:58.120
そうすると勝手にAIは賢いのでそれを踏まえて正確な文字起こしを気を利かせてやってくれるのでこういうプロンプトを入れておくとより文字起こしの精度が上がります。

00:11:58.120 --> 00:12:02.120
今が100点だとして120点になってきますのでぜひこのプロンプトをお試しください。

00:12:02.120 --> 00:12:08.120
はいということで今回は無料のAI文字起こしツールの最終結論をお届けしました。

00:12:08.120 --> 00:12:15.120
現時点での最終結論文字起こしで使うなら実用的に無料でコーヒー椅子で使うならGoogleのGeminiです。

00:12:15.120 --> 00:12:17.120
はいぜひ使ってみてください。

00:12:17.120 --> 00:12:24.120
今回の動画が勉強になったとかやっと答えが見つかったと思っていただけたら高評価やチャンネル登録の方よろしくお願いいたします。

00:12:24.120 --> 00:12:26.120
それでは次回の動画でお会いしましょう。

00:12:26.120 --> 00:12:28.120
スモールビジネス特化の学びやこの早でした。
