AIツールの比較
皆さん、こんにちは。40歳からのAI活用塾のウミノです。このチャンネルでは、AIを活用して1日に時間・時短をする実践的なテクニックと、時間と場所に縛られない働き方のヒントをお届けしていきます。
さて、今日はですね、私が3つのAIツールを使って、小さい文字の書かれているJPEGファイル、これをですね、文字起こししてもらったその比較結果についてお話をしようかなと思っています。
試したのは、ChatGPTとクロードと、あとはGoogle AI Studioですね。はい、これはジェミニじゃなくて、Google AI Studioの方です。
では、結果はどうだったかと言うとですね、結構散々たる結果でして、まずChatGPT。ChatGPTがですね、意外と小さい文字読めないのかなぁ。
ChatGPTも画像の文字認識できるはずなんですけれども、なんか何かおかしかったんですかね。全然できませんでした。
まずGPT-4.0とGPT-4.5とO3-miniとO3-miniかな。これを試したんですけれども、基本的にはGPT-4.0でいいと思うんですね。
GPT-4.0でできるはずなんですけれども、なんかテスサラクトだったかな、なんか文字認識のOCRが入っていないのでダメですみたいなことを言われて結局できませんでした。
他のモデルに変えてもChatGPTでは一切文字起こしができないみたいな状況だったんですよね。
もしかしたタイミングのせいなのかもしれないんですけども、ちょっとね全く使い物になりませんでした。
ちょっとChatGPT残念。続いてですね、クロード。これはねどうかというと一瞬できたように見えるんですけれども、全然ダメだった。全然ダメでしたね。
なんか本来だったらいっぱい書いてあるところが全く違う内容になっていたりとか、一部は正しいんだけれども、なんか勝手に作っちゃってるみたいな。勝手に作られるの困りますよね。
読めないなったら読めないなりになんか文字化けというか、なんか変な風に例えばね、リーをイーにするとか、そういう感じでやってほしいんですけれども、勝手に内容を作ってきましたね。
Google AI Studioの結果
もう全然ダメでした。全然ダメ。そしてじゃあAI、Google AI Studio。これね今すごいあのホットなんですけども、無料で使えるんですよね。
これねすごい皆さんに人気なんですけども、なんか私が使うといつも大体微妙なのはなぜなんだろう。
まずこのGoogle AI Studioというのは開発者向けのプラットフォームになっていて、いくつかモデルを選べるんですね。で無料で使えます。
で私今回使ったのはGemini 2.5 Pro、Preview 3.25ってやつと、Gemini 2.0 Flash、Image Generation Experimentalっていうこの2つを使ってみました。
でですね、結局まず、今すごいみんながすごいすごい言ってるGemini 2.0 Flash Experimentalかな。これがね、これだっけ、これだった気がするんですけども、これがダメでしたね。
全然ダメだったなぁ。これもなんか勝手に作るは、勝手に作ってるし、なんか全然違う感じになってる。全然違う感じになってました。
まだまとも、比較的まともだったのがGemini 2.5 Pro、Preview 3.25って一番新しいモデルですね。これが一番まだマシかな。
という感じでした。ただし、ただしですよ。やっぱり勝手に作ってますね。
なんだろう、それっぽいことを勝手に書き出しちゃったりとかしているので、これは本当困りますね。どうすればいいんだろう。
ちょっとなんか、難しいなぁという感じですね。
普通の大きさのPDFとか、普通の大きさの文字のJPEGとかね、解像度の高いJPEGとかだったら、多分どのツールでもそれなりにいけるんだと思うんですけども、ちょっとボヤッとなってしまっているような、例えばなんだろうな、画面のスクリーンショットとか、本当にちっちゃい文字で、ちょっと老眼の私とかだときついなぁみたいな、そういう文字だと、
こんな感じで、今回お伝えしたような感じで、どのツールでも難ありっていう感じになりました、結果としては。でもそう思うとね、老眼ではあってもですよ、読めるんですよね、人間は。人間の目ってすごいなぁと。目と脳かな。人間の目と脳ってすごいなぁと思いました。改めて。
それに比べると、やっぱりまだちょっとAIももう少し頑張ってほしいなっていうところではありますね。ただまぁ、頑張ってくれているとは思うし、すごいことだとは思うんですよね。これでAIで読めるっていうのもすごいなと思うし、あとはまた2、3ヶ月経ったらね、また全然違う結果になるんだろうなぁと思いますので、引き続き楽しみにしています。
ちなみに私はですね、今最近ちょっと全然パソコン触れなかったので、クロードはプロプランを年間契約をしている状態で、チャットGPTは20ドルのプラスプランに落としています。もうちょっとしたらプロプランに戻そうかなとは思っています。
で、ジェミーには何も入っていない。もう辞めてしまったという感じですね。
はい、そんな感じで、あとはフェローは無料プランで使わせてもらっていて、パープレキシティは一応無料、有料プランをLINEに入っているので無料で使わせてもらっているっていう感じになっています。
あとはジェンスパークか、ジェンスパークも何かの得点か何かで有料プランに入らせてもらっているような感じですね。何ヶ月間か入らせてもらっている感じになります。
なんかね、やっぱみんなすごいすごい言ってるけれども、使いづらいところもあるんだなーっていう感じですね。それはしょうがないですね。
ということで、限界を知りつつうまく使っていきたいと思います。ご参考になれば幸いです。
それではまた。うみのでした。
うみのとなまぐえ アイとマーケティング
みんなでななぼうえ アイとマーケティング