1. 耳で学ぶAI、ロボシンク
  2. #27 ChatGPT, Claude, Gemini...
2024-07-17 17:40

#27 ChatGPT, Claude, Gemini..複数のAIを一括で比較する

[note: 補足コンテンツ]

https://bit.ly/4c19gfv


---

生成AIのニュースレターを始めました🎉 AIの最新情報や知見を効率よくキャッチアップできます。

登録はこちらから→⁠⁠⁠⁠https://bit.ly/3Cq9LDG⁠⁠⁠⁠

---


【内容】

- ChatHub、天秤AIを使ったAI比較

- プロンプトの改善だけではなく別のAIと比較する視点を持つ

- Gemini、実はスゴイ


「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。

---

👨‍💻パーソナリティ

矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。


◎note

https://bit.ly/3LvtP91


◎X: 矢野哲平

https://bit.ly/3Tx6maM

---

【リソース】

◎ChatHub

https://chathub.gg/ja


◎天秤AI

https://tenbin.ai/

---

◎番組の感想や要望はこちら

https://forms.gle/VMyVYWzHSNKZFu787

00:08
みなさんこんにちは、ロボシンクの矢野です。この番組は、耳で学ぶAIをコンセプトに、初心者向けにAIを分かりやすく解説する番組です。
今回のテーマは、ChatGPT, Claude, Gemini..複数のAIを一括で比較する、について話していきます。
はい、ということで今日は、複数のAIを比較する、をテーマに話していきたいと思います。
みなさん、AIは何を使っていますでしょうか? おそらく多くの人が、ChatGPTを使っているよ、という人多いと思います。
私もですね、メインでChatGPTを使っています。 ただいろいろAIを使ってみると、このタスクにおいてはこっちのAIの方が便利だなって思うことはですね、
結構あるんですね。 一つのAIを使うわけではなくて、他のAIと比較して使うっていうのも一つの方法だと思います。
今日はこうした、複数のAIを比較する、という観点から話していきたいと思います。
今日は主に2つのことを中心に話していきます。 1つ目は、AIを一括で比較する方法ですね。
天秤AIやChatHubというサービスについて話していきます。 そして2つ目は、それぞれのAIが得意とすることについて話したいと思います。
ここまでいろいろなアップデートや機能の追加がありましたよね。 それぞれのAIが持つ特徴、こういったことについても話していきたいと思います。
はい、ではAIを比較する方法からまず話していきたいと思います。 例えば、複数のAIを比較したいとき、そうですね
例えば、取引先へ送るメールを作成するというシーンを想定してみましょうか。 取引先へ送るメールをAAを使って作成すると。
ここでは、ChatGBTやクロード、ジェミニなど、どのAIが一番いい回答、メールですね、を生成してくれるのかを調べたいとします。
これ実際に比較をシンプルにやると、各AIサービスのホームページを開いてプロンプトを入力するわけですね。
ChatGBTを開いてプロンプトを入力して、クロードを開いてプロンプトを入力、ジェミニでも同じことを繰り返すわけです。
これって結構面倒ですよね。 ただ、こうした手間を省くために、一つの画面の中で複数のAI、
ChatGBTやクロードですね、そういったものを比較できるサービスというのがあります。 例えば、メールを作成する例で言うと、取引先へ送るメールを作成したいとします。
そのプロンプトを一つ入力するだけで、ChatGBTとクロードとジェミニが同時にそのメールの下書きを作成してくれると。
03:05
こういったサービスがあるわけですね。 なので、わざわざ複数の画面を開いてプロンプトを何度も入力して、こういった手間を省けるサービスというのがあります。
有名なサービスで言うとChatHubというのがあります。 これはChromeの拡張機能ですね。
ChromeというのはGoogleが開発しているブラウザーですね。 パソコンの画面を開いてインターネットにアクセスするときに使っているのがブラウザーですね。
それのChromeの拡張機能としてこのChatHubというのがあるわけです。 このChatHubを起動するとChatGBTのような画面が出てきて、プロンプトを入力することができます。
ここで先ほどのようにビジネスメールを作成してと入力すると、ChatGBTとクロードの回答結果というのが同時に生成されます。
なので、一つのプロンプトでChatGBTとクロードの回答結果というのを比較できるわけですね。 これ結構便利なんですよね。
ChatHubには無料プランと有料プランがあります。 基本的には無料プランで問題ないです。
無料プランの場合は最大で2つのAIというのを同時に比較することができます。 例えばChatGBTとクロードを比較したり、ChatGBTとジェミニを比較したりといった具合ですね。
有料プランになると最大で6つのAIを比較することができます。 一つのプロンプトを入力するだけで最大で6つのAIの回答結果を比較できるというわけですね。
これが月額19ドルからですね。 現在のレートだと約3000円ぐらいの金額になります。
ChatHubでも十分利用できるんですけど、2つ以上のAIを無料で比較したい時っていうのはお勧めのサービスが天秤AIというサービスですね。
名前からわかるように日本のサービスになります。 これですね、GMOっていう会社が出しているサービスになります。
GMOはテレビCMなんかもやっているので聞いたことがあるという人も多いと思います。
GMOクリック証券とか、あとはオナマエドットコムなんかのサービスを運営している会社ですね。 このGMOはAIに非常に力を入れている会社でもあります。
そのGMOが先月に6月ですねに公開したのが天秤AIというサービスなわけですね。
この天秤AI、ざっくり言うとChatHubと同じようにですね、複数のAIを比較できるサービスになります。
現時点での話にはなるんですけど、機能の面で言うと圧倒的に天秤AIの方が勝っていますね。 まずAIの比較機能。
ChatHubだと無料の範囲で利用できる、比較できるAIの数っていうのは2つでした。
06:05
ChatGPTかCloudとか、あとはChatGPTかGemini、2つだけの比較だったわけですね。
天秤AIの場合だと無料で最大6つ比較することができます。 あとは比較できるAIも豊富ですね。
まずGPT-4Oも使えますし、あとはGemini 1.5 Proも使えますし、 あとは最近公開されたばかりのCloud 3.5 SONNETも使うことができます。
あとはFacebookの会社、現在はメタ社というメタという会社に名前が変わっていますけど、
メタが開発するラマ3も比較の対象になります。 あとは検索特化のAIであるパープレキシティですね。
パープレキシティも比較対象として使うことができます。 なので有名どころのAIっていうのは全部抑えている感じなんですね。
でこれらのAIを全部無料で比較できると。 使っているこっち側がちょっと逆に心配になってしまうレベルですね。
GMOさん大丈夫ですかと。 ユーザーとしては非常にありがたい話なんですけどね。
ただこんなに無料で使わせてもらっていいのかなと、逆に恐縮しちゃうぐらいのレベルですね。
それだけ非常にお得なサービスだと思います。 こうした感じで複数のAIを比較して使うっていう視点を
日々のAIの利用に取り入れるとおすすめです。 別に毎日じゃなくても気になった時にさっと確認するだけでもいいと思います。
例えばAIであるタスクを実行する時に一番いい回答を得るためにいろんな工夫をすると思います。
もっといい回答を引き出すためにプロンプトを何度も実行したりとか、 あとはプロンプトテクニックを駆使してプロンプトを改善したりとかですね。
そういったプロンプトの改善とは別の軸で他のAIと比較するという視点を取り入れるとおすすめです。
ちょっと具体例を交えて話します。 以前のエピソードでも少し話したんですけど、
AIを使って文章の構成をするという作業をしています。 文章の構成というのは、誤字脱字や漢字の間違いを発見する作業ですね。
人間が書いた文章をAIに投げて誤字脱字を発見してもらうと、こういった作業になります。
結論から言うと、いろいろなAIで試した結果、 ChatGPTのGPT-40が一番精度が良かったんですね。
こういったように、あるタスクにおいてはこのAIの方が精度が高いとか、 このAIは精度が低いっていうのは結構あるんですね。
文章の構成の精度を上げるためにプロンプトを工夫するっていうのが普通のアプローチだと思います。
ただですね、プロンプトを工夫するにしてもAIの限界があったりとか、 向き不向きがあったりするわけですね。
09:02
で、こうしたケースだとプロンプトを改善するよりも、 そもそもその文章構成に最適なAIを選んだ方が回答結果が良くなるっていうケースは結構あるんですね。
画像や動画のAIを使っている人は感覚的にわかると思うんですけど、 いくらプロンプトを工夫しても最新のモデルにはかなわないんですよね。
例えば1年前の古いバージョンで、いくらプロンプトを工夫しても、 最新のモデルを使った方がシンプルなプロンプトでも精度の高い画像や動画ができる。
こういったことはよくあるんですけど、それと同じようなイメージですね。 こうしたAIを比較するときに天秤AIなどのサービスを使うと効率化できますよという話になります。
例えば取引先に送るメールをAIで作るとします。 その時により自然なメールを作成してくれるのはチャットGPTなんだろうか、
クロードなんだろうかということを簡単に調べることができます。 会社の資料を作るときに、より深い内容や視点を得られるのはどのAIなんだろうとか、
あとはアイデア出しにもっと使えるAIってどれなんだろう。 こういったプロンプトの修正とは別の軸で、他のAIを使ってみるという視点は非常におすすめです。
AIにも色々と特徴があって、それぞれ得意なことや不得意なことっていうのは色々持っているわけですね。
例えば先ほど話した文章構成ですね。 現状は私が試した感じだと、チャットGPTのGPT-40が一番スコアが高いですね。
日本語の文章の文字構成をするなら、現時点ではGPT-40一択だと思います。
これ、クロード3.5ソネットが一番最近出たモデルでは新しいものになるんですけど、私がテストした感じだとクロード3.5ソネットよりもGPT-40の方がスコアが高かったですね。
文章構成のタスクにおいてはですね。 文章の生成に関しては
どうですかね。個人的にはクロード3.5ソネットがいいかなと感じています。 もともとクロードって文章生成が得意って言われていますよね。
なので自然な日本語の文章を書きたい場合は、現時点ではクロード3.5ソネットかなと思います。
で、その他の例で言うとアイデア出し。 アイデア出しに関しては、これはですね
特にAIは固定せずに複数のAAを使った方がいいと思います。 アイデア出しならチャットGPTとかアイデア出しならクロードを使うとか
特にAAは固定せずに複数のAAからアイデアを募った方がいいと思います。 複数のAAを使うといろんな角度からアイデアが出てくるので
あとはそのアイデアを人間側で取りまとめて整理していくと。 それこそアイデア出しなんかは天秤AAを使って複数のAIからアイデアを募る
12:05
そっちの方がですね効率的だと思います。 ちょっと話は変わるんですけど、ジェミニーどうでしょうか
ジェミニーなんですけどあまりこう使っている人は多くない印象ですけど皆さんどうでしょうか
チャットGPTとクロードは使ってるけどジェミニーは使ってないっていう人も中には多いかもしれません
でもジェミニーはですねチャットGPTやクロードが持っていない圧倒的なアドバンテージを持っているんですね
それがコンテキストウィンドウですね。 コンテキストウィンドウがチャットGPTやクロードと比べて圧倒的に大きいわけです
でこのコンテキストウィンドウっていうのはそうですね簡単に言うとチャットでどれだけの情報保持できるかというものですね
より多くのコンテキストウィンドウがあればたくさんの情報をチャットの中に詰め込めると これはGPT-40だとコンテキストウィンドウは12万8千なんですね
でクロード3.5ソネットだと20万ですね コンテキストウィンドウは20万と
でこれジェミニーの1.5プロになるとコンテキストウィンドウは何と200万になるんですね なのでGPT-40が12万8千ですね
でクロード3.5ソネットでも20万。でジェミニーの1.5プロだと200万ですね 一気に10倍近い数字を叩き出しているわけですね
これは他のAIに比べても圧倒的な数字ですよね しかもこれ今は無料で利用できるんですよ
なのでこれを利用しない手っていうのはないかなぁと思っています 例えば会社に大量の資料があるとします
個人の方の資料でもいいですとにかく手元に大量の資料があると でこれをAIを使って要約をさせたいとします
でただあまりにもこの資料が大きすぎてチャットGPTやクロードでは対応ができないと 対応が難しいと
でこうした時に圧倒的なコンテキストウィンドウ誇るジェミニー1.5プロが役立つわけですね 大量の資料を情報を読み込ませてそれを要約させて
あとは読み込ませた資料から情報を検索したりとかですね PDFの資料を要約させるっていうタスクはチャットGPTもできるわけです
ただ無料版の場合はアップロードできるファイルのサイズっていうのも上限があります で有料版になってもアップロードできるサイズには上限があります
でまぁそれはそれであの問題はないんですけど 大量の資料をアップロードしたいときとか
あとはものすごく長いテキストをAIに読み込ませたいとき こういった時にはジェミニー1.5プロがおすすめですね
あとは動画をアップロードして要約させたりとか 動画の内容を文字起こししたりとかそういった使い方もできます
社内のセミナー動画とかにも使えると思います こういった感じでメインで使うAIというのは自分の中で持っておいて
15:07
今目の前にあるタスクこれからやるタスクっていうのを別のAIで試してみたらどうなるんだろうっていう視点は頭の片隅に置いておくといいと思います
なんといっても無料で公開されているAIがほとんどなので 一つのAIに絞るっていう選択肢はちょっともったいないかなぁと思うわけです
あとは早いペースでどんどん新しいAIが公開されていくので 常にアップデートしていくにはやっぱり複数のAIを比較するっていう作業が必要になってくると思います
でそこで自分の業務にマッチしたAIというのを見つけることができれば さらにですね回答精度が上がって業務効率化につながるというわけです
今日のポイントをまとめます 複数のAIを一括で比較したいときこれは天秤AIがおすすめです
GMOのサービスですね天秤AIおすすめです 二つ目に各AIで得意なことっていうのは分かれます
メインのAIを使いつつ時々他のAIで試してみるのもありだと思います なぜならプロンプトを工夫するよりもAIを変えた方が劇的に改善されるケースがあるからですね
例えばChatGPTで大量のテキストを処理したいと思っても もともとChatGPTで決められている仕様で限界があります
これはですねプロンプト動向で解決できる話ではないわけですね こうしたケースでは大量のテキストを処理できる
Geminiを使うと そういった複数のAIを使い分けるという視点を持ちながら
AIと付き合っていくといいんじゃないかなと思います はい今日はこの辺ということで本日も聞いていただきありがとうございました
今日話した天秤AIですね 初めて使う場合ちょっと操作方法など少しわかりづらい部分もあるかもしれません
補足のコンテンツとしてノートで別で記事を書きました 興味ある方はこちらもチェックしてみてください
このように番組ではAIの情報を毎週発信しています 毎週水曜朝に更新していますのでぜひフォローお願いします
Xもやっています XではAIの最新情報やプロンプトを発信しています
概要欄にリンクを貼っておきますのでこちらもフォローお願いします あとエピソードの中で話したサービスですね天秤AIとか
あとはチャットハブですね これのサービスについても概要欄にリンクを貼っておきますのでチェックをしてみてください
お相手はロボシンクのヤノでした また次の配信でお会いしましょう
17:40

コメント

スクロール