AIモデルの紹介
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、どのAIを使う、タスク別の使い分けについて考える、について話していきます。
はい、ということで今日は、AIの使い分けについて話していきます。皆さん、AIはタスクに応じて使い分けていますでしょうか。
今回、AIモデルの使い分けを話す理由としては、AIを触り始めると、おそらく多くの人が遭遇する問題だと思うからです。
チャットGPT、触り始めたけど、よくよく見てみると他にも色々AIがあるなと。結局、どれを使えばいいのと感じている方も多いと思います。
このポッドキャストでも、リスナーの方から、あの、AIがありすぎて、どのような場面で使えばいいのかわからないという話はよく聞きます。
そのため、今回のエピソードでは、現時点におけるAIモデルの特徴やユースケースについて掘り下げたいと思います。
今日話すポイントは主に3つです。1つ目に、現時点のAIモデル、あとは直近で発表されたニュースも交えて話します。
そして2つ目に、タスク別のユースケースについて紹介します。そして最後3点目に、AI各社の特徴について解説します。
チャットGPT、ジェミニ、クロードの特徴をまとめます。AIモデル、いろいろありすぎてわからないという人は最後までお付き合いください。
はい、では早速話していきましょう。まず一番最初に、現状リリースされている最新のAIモデルについて確認してみましょう。
まずチャットGPTがGPT4.5プレビューというものになります。そしてクロードがクロード3.7ソネット、ジェミニがジェミニ2.5プロエクスペリメンタルとなります。
この中で最近リリースされたのがジェミニ2.5プロですね。この後のエピソードでもジェミニ2.5プロについて触れますけど、すごいモデルですね。
そして直近のAIニュースもいくつかあります。まずメタ。メタっていうのはフェイスブックやインスタグラムの会社ですね。
その会社が公開しているラマというオープンソースのAIモデルがあります。誰でもオープンソースで使えるというモデルです。
このラマからラマ4という最新モデルがリリースされました。そしてオープンAIからもニュースがあります。
実サムアルトマン、オープンAIのCEO、サムアルトマンがO3とO4ミニを数週間以内にリリース予定とのことです。
その後数ヶ月以内にGPT5をリリース予定と発表しています。
オープンAIの現状のモデルで言うとGPT4.5とかあと4Oとか、あとは推論モデルになるとO1、O3ミニなどありますが、
それの次バージョンですね。次のバージョンを早くて数週間以内、そしてGPT5という大型のアップデートですね。
これを数ヶ月以内に実装予定とのことです。バージョンアップしたらどれだけ性能が良くなるんだと非常に楽しみなトピックでもあります。
とはいえ現状がですね、最新モデルがチャットGPTのGPT4.5、アンソロピックのクロード3.7ソネット、そしてグーグルのジェミニ2.5プロとなります。
タスク別ユースケース
はい、ではここからは早速タスク別のユースケースについて話していきます。
他のユーザーの意見と、あとは実際に私が使っていく中で、このタスクではこのAIが使いやすいというような視点を交えて話していきます。
まず日常の利用ですね。これはやっぱりチャットGPTが一番使いやすいかなと思います。
総合的に見て一番バランスが取れているのかなと。初めてAIを触る人はですね、チャットGPTやっぱり使いやすいかなと思います。
AIといえばチャットGPTみたいなイメージがあってみんな使ってますよね。
日常の利用、メインのAIはやっぱりチャットGPTがおすすめかなと思います。
では次に音声会話ですね。AIと音声で会話をするような機能となります。
でこれ、チャットGPTとジェミニ実装されているんですけど、チャットGPTの方がおすすめです、現時点では。
チャットGPTにはアドバンスドボイスモードという高度な音声機能というのがありまして、これがですね、かなり使いやすいんですね。
ジェミニにも似たような機能があるんですけど、やっぱりチャットGPTの方が使いやすいと思います。
結構この音声会話っておすすめで、例えば日常の中で口と耳が空いているシーンって結構あるんですよね。
例えば洗い物をしているシーンとか、洗濯物をたたんでいる時、洗濯物を干している時、結構こういう時って口と耳って空いています。
なのでこういった細切れの時間にチャットGPTに質問をして、インプットの時間に当てると。
例えばこういうアプリを開発しようと思うんですけど、どういった技術を採用すればいいですかとか、こういったアイディアがあるんですけどちょっと壁打ちさせてもらってもいいですかとかですね。
その会話内容っていうのはすべてチャットのログとしてテキストベースで残ります。
なので後で自由に加工したりエクスポートするそういった使い方もできます。
音声会話ですね、ちょっと非常におすすめなのでぜひ試してみてください。
はい、では次は文章作成に行きましょうか。
資料の文章とか、あとはメールの文章を作成するようなタスクです。
これ結構ですね、どのAIが優れているのかって決めるの難しくてですね、好みとか、あとはその文章の内容とかにもよると思います。
基本的な考えとしては、やっぱりクロードが使いやすいかなと思います。
なんと言いますか、AIっぽくない自然な文章、これはやっぱりクロードが得意とするところだと思います。
はい、では次は文章構成となります。
これは文章の誤字、脱字などを発見するタスクですね。
文章の間違いを発見するタスクっていうのは結構幅広い触手で使えるので、AAを使った文章構成というのはおすすめです。
で、この文章構成にどのAAが適しているのかっていうと、私が試した結果だとGPT4.5ですね。
で、その次にGemini 2.5 Pro、その次にクロード3.7 Sonnetという順番になりました。
あの、Geminiって結構日本語の文章作成とか、あとは文章の構成、そういったタスクは苦手なイメージがありました。
ただ、Gemini 2.5 Proになって結構日本語の精度も良くなってきているんですよね。
ちなみにGPT 4.5は現時点では有料プランでないと利用ができないですね。
なので、その代わりの手段として無料で使えるGPT 4.0や、もしくはGemini 2.5 Proという選択もありだと思います。
ちなみにGemini 2.5 Proは無料で使えます。
では次は資料の要約に行きましょう。
例えば資料の情報を抽出して要約するようなタスク、これはですね、はっきり差が出ました。
私が試した環境ではGemini 2.5 Proがおすすめです。
結構大きめの資料を要約する、情報を抽出する、そういったタスクは推論モデルが得意なんですね。
例えばChatGPTであればO1とか、あとはO3などの推論モデル。
こういったモデルが得意なんですけど、私が試した環境ではGemini 2.5 Proの方が抽出要約の精度は高かったです。
あとGemini 2.5 Proは他のAIに比べてコンテキストウィンドウがかなり大きめです。
このコンテキストウィンドウっていうのはAIの短期記憶のようなもので、
AIがどれだけの情報を扱えるかみたいな目安ですね。
それがGemini 2.5 Proは100万トークンあるので、資料の容量が大きくなればなるほど活躍してくれると思います。
プログラミングと各社の特徴
それでは最後はプログラミングいきましょう。
プログラミングに関してはクロードがおすすめです。
これはずっと言われていることですね。
ただですね、最近リリースされたGemini 2.5 Proもおすすめです。
実は私毎回新しいAIのモデルが出る度にプログラミングで試しているタスクがあるんですね。
それがChrome拡張機能の開発のタスクとなります。
ある機能を持ったChrome拡張を開発すると。
しかもほぼほぼワンショットで。
つまりですね、かなり短い指示というか簡潔な指示でAIにこういったChrome拡張機能を作ってくださいと依頼をするわけです。
今までGPT 4.5とかChrome 3.7ソネットが出る度にそういったタスクを実行していました。
会話を何度も重ねていってこういったエラーが出ましたよと修正お願いしますと。
会話を重ねていけば完成はするんです。
でもですね、ワンショットほぼほぼ少ない指示だけでこのChrome拡張機能が完成したのはGemini 2.5 Proが初めてでした。
この事例というのはかなり狭い範囲の成功事例になると思います。
私があるChrome拡張機能の開発で試した事例なんですけども。
やっぱりですね、インターネット上の情報とかを見てもGemini 2.5 Proのコーディング能力すごいというふうに言われているので。
結構私だけじゃなくて他の方も同じように感じている方は多いようです。
なのでもしプログラミングをしていてですね、エラーで進めませんと、
ChatGPTもChromeもお手上げですという時にはですね、ちょっとGemini 2.5 Proに質問してみるのもアリだと思います。
特に最近今までプログラミングをしたことがなかったけど、AIを使ってコードを書いていますという方は非常に増えています。
例えば自分の業務を効率化するコードを書いたりとかですね。
そういった場合にChromeもおすすめですけど、最新のGemini 2.5 Proもおすすめですよということはお伝えしておきたいと思います。
最後にAI各社の特徴なんかについてざっくりまとめたいと思います。
まずオープンAIのChatGPT。これはオールマイティーですよね。
初心者でも使いやすい設計で、世界で一番使われているAIだと思います。
日常使いから、あとは最近だと画像生成なんかもすごいですよね。
これは前回のエピソードでも話したFor Image GenerationというChatGPTの画像生成の機能となります。
ChatGPTには無料プランと有料プランありますが、結構無料プランでもできることっていうのは増えているんですね。
現時点で言うと有料プランのメリットは、やっぱりChatGPTのディープリサーチですかね。
色々とAI各社がディープリサーチ系のサービスというのをリリースしています。
AI精度の比較
ただ色々使った感じだとですね、やっぱり精度の面で言うとChatGPTのディープリサーチが一番精度が高いかなと思います。
はい、では次にGoogleのGemini。
Geminiって以前までは日本語のタスクはあまり得意ではなかったんですね。
やっぱりGeminiよりもChatGPTの方がいいよねと思う人は多かったと思います。
実際に私もそうでした。
でも最近そうですね、特に2024年の後半からGoogleの追い上げっていうのがすごいんですよね。
最近リリースされたGemini 2.5 Pro。
これもかなり精度が高いので、まだ使ったことがないっていう人は是非試してみてください。
これはですね、Geminiの無料プランからでも利用できます。
あとGeminiはディープリサーチの機能も無料で利用できるようになっています。
これも大きいと思います。
ディープリサーチ系のサービス、あの私先ほどChatGPTが精度が高いというように話しましたけど、
Geminiのディープリサーチも負けてないですね。
自分が試した感じだとChatGPTのディープリサーチとあとはGeminiのディープリサーチ、
これで1位と2位を争っているような感じがします。
で、あとGoogleとAIを語る上で欠かせないのがGemini以外のサービスですね。
AIモデルを搭載した情報管理ができるノートブックLM、
あとはGoogleの最新モデルを無料で試せるGoogle AI Studio、
どちらもかなり強力なツールとなります。
過去にもこのポッドキャストでノートブックLMとGoogle AI Studioの紹介をしたんですけど、
CloudとMCPの解説
まだ使ったことがないという人はいずれにしろ無料で使えるツールなので是非試してみてください。
そして最後にアンソロピックのCloud行きましょうか。
Cloudはやっぱり文章の作成とあとはプログラミングに強いですね。
これ何と言えばいいんですかね、あの作業がしやすいんですよね。
こちらの質問に対する意図を汲み取ってくれるというか、
プログラミングで作業するときに傍らに置く相棒はCloudがやりやすいなという印象はあります。
で、以前にこのポッドキャストでもアメリカのサンフランシスコのスタートアップで
クリエイトXYZというプロダクトを開発している企業にインタビューをしました。
で、その時にクリエイトのデザイナーの方もCloudをしていましたね。
特にデザインを伴うプログラミングなどはCloudがお勧めだと思います。
で、直近のアンソロピック、Cloudを語る上でちょっと外せないのがMCPのトピックですよね。
これモデルコンテキストプロトコルの略なんですけど、耳にしたことがあるよという人もいるかもしれませんし、
いやちょっと初めて聞いたよという人もいるかもしれません。
これですね、ちょっと話し出すとかなり長くなってしまうので、また別の機会にMCPに関しては深く掘り下げたいと思います。
ちょっと軽く補足すると、MCPっていうのはアンソロピックが発表したAIの規格のようなものです。
規格っていうのはイベントの規格とかそういうのではなくて、USBの規格とかそういったものですね。
アンソロピック自身はMCPをUSB Type-Cのようなものだと言ったりしています。
MCP、音声だけで説明するのちょっと難しいんですけど、AIからいろいろなツールに接続ができるようになると。
例えばですね、AIからブラウザを自動で操作して、あるURLにアクセスをすると。
その内容を要約してもらって、その内容をパソコンのデスクトップフォルダにテキストファイルとして作成してもらうと。
AIからブラウザやファイルの操作ができるようになると。
ここで挙げたのはあくまで一例となります。
今、MCPでできることっていうのはものすごいスピードで増えているので、先でこのMCPについても取り上げたいと思います。
ちなみにこのMCPっていうのはアンソロピック独自の機能ではありません。
オープンソースの企画なので、今AI各社がですね、ポゾって開発をしています。
最近ではオープンAIもこのMCPをうちでもサポートしますよと発表しました。
おそらく近々ですね、ChatGPTのアプリからもMCPを使っていろいろなことができるようになると思います。
今はまだMCP使っている人少ないと思うんですけど、
ChatGPTが実装してくると、やっぱりユーザ数がChatGPTが多いので一気にMCPが広まりそうな感じもします。
今回話した内容、ChatGPTのGPT4.5と、あとはクロード3.7ソネット、ジェミニ2.5プロ、
これらのモデルを比較した内容っていうのはノート記事にも書いています。
概要欄にもリンクを貼っておきますので、興味のある方はこちらも覗いてみてください。
はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。
ちょっと話は変わるんですけど、ポッドキャストの感想フォームからお便りをいただきました。
ちょっと読みますね。
矢野さん、いつも有益な情報を丁寧な語り口調で発信してくださってありがとうございます。
今最新を聞きつつ、1話からも一つずつ聞いています。
矢野さんはジェンスパーク使われていますか?
仕事上、役立つなら自分でも使いたいし、日々多忙な夫にも勧めようと思いますが、
メリット・デメリットなどがあれば教えていただきたいです。
お便りありがとうございます。
ジェンスパーク自体はですね、ちょっと実は私使ってないんですけど、
最近いろいろ新しい機能を追加して話題になっていますよね。
ジェンスパーク使ってないのでアレなんですけど、
ジェンスパークのような検索AI全般のメリット・デメリットについて少しお話しすると、
まずメリットがですね、従来の検索に比べて検索タスクの効率が良いということですね。
あとは自然言語、つまりAIと会話をするように調べ物ができる。
これはやっぱり従来のキーワード検索にはなかったメリットだと思います。
デメリットについてお話しすると、やっぱりハルシネーションですかね。
特に最新情報とか専門的な内容になると、ハルシネーションを起こしやすくなります。
これはジェンスパークだけに限った話ではないです。他の検索AIとか、あとは生成AI全般ですね。
なのでジェンスパークのような検索AIを使うときはですね、ハルシネーションに注意しつつ使っていくことをお勧めします。
予防策として、外部に出す資料、そういった時に使う場合はノーチェックで出さないということでしょうか。
外部に出す場合に検索AIで収集した情報はノーチェックで出さないということですね。
反対に内部で消費する資料、ある程度のざっくりとした情報を知りたいとき、そういった時はノーチェックでも問題ないと思います。
こんな感じで検索AIで取得した情報をどこで使うのか、どういった場面で使うのか、そういった場合に応じて使い分けるとお勧めです。
あとはジェンスパークは、その他の検索AIもそうですけど、APIというのを公開しているので、情報収集のタスクを自動化することもできます。
これも一つの活用アイディアとして検討してみてください。
はい、お便りありがとうございました。
番組ではこのように耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報をキャッチアップできます。
毎週水曜朝に更新していますので、ぜひフォローをお願いします。
おすすめの生成AIツールをまとめた資料も配布しています。
興味のある方はこちらもぜひ概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野てっぺいでした。
また次の配信でお会いしましょう。