1. 耳で学ぶAI、ロボシンク
  2. #54 Perplexity APIから新モデ..
2025-01-29 22:49

#54 Perplexity APIから新モデルSonarが登場!AIを使った情報収集, Operator雑談

✍️内容

Perplexityから新しくリリースされたAPIモデルのSonarについて話しました。以前からAPIのモデルはありましたがどの位、精度が上がっているのか実際に使用した感想も交えて紹介します。

そして、OpenAIのOperator!

雑談的にOperatorに関する情報をまとめました。

---

おすすめの生成AIツールをまとめた資料を配布中🎉

資料を受け取る→⁠⁠⁠https://bit.ly/3Cq9LDG⁠

---

🔗リンク

Perplexity Playground

Operator | Youtube

Perplexity API Sonar(note記事)

Perplexity Assistant

---

「耳で学ぶAI」ではChatGPTやGemini、Claudeなど生成AIを初心者・中級者向けに分かりやすく解説します。

---

👨‍💻パーソナリティ: 矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。

note

X: 矢野哲平

---

📩番組の感想や要望はこちら

⁠https://forms.gle/VMyVYWzHSNKZFu787

サマリー

今回のエピソードでは、Perplexity APIから新たにリリースされたAIモデルSonarの機能や精度について詳しく解説されている。また、AIを活用した情報収集の新しいアプローチや、OpenAIのOperator機能についても触れられている。パープレキシティAPIから新しくSONARモデルが登場し、このモデルは情報収集の能力を大幅に向上させている。また、オープンAIのブラウザ版AIエージェント「オペレーター」も紹介されている。

Sonarモデルの紹介
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、Perplexity APIからリリースされた新しいAIモデルSonarについて話していきます。
今日はPerplexityのAPIの新しいモデルについて話したいと思うんですけど、ちょっとですね、今日は色々なトピックも紹介したいと思います。
というのが、直近1週間で結構色々な出来事があったんですね。 PerplexityからAPIの新しいモデルSonarがリリースされたこと、
あとはOpenAI、ちょっと全然Perplexityとは関係ないんですけど、OpenAIからOperatorという新機能が公開されたこと。
先に言うとですね、このOperatorですけど、私含めて日本の方っていうのはまだ使えません。
先行してアメリカで公開された機能となります。 これ簡単に言うとですね、ブラウザーをAIから操作できる機能となります。
まだ利用はできないんですけど、ChatGPTユーザーは抑えておきたいトピックだと思ったので、後半でこのOperatorについても話したいと思います。
今日話すポイントは主に3つとなります。 Perplexity APIから新しいモデルのSonarがリリースされたこと、
あと実際に使ってみた感想です。 そして2点目にAIを使った情報収集全般について少し話したいと思います。
そして3点目にOpenAIのOperatorについて話したいと思います。 はい、では早速話していきましょう。まずはPerplexityのAPIのSonarですね。
Perplexity使っている人も多いと思います。検索AIの立役者ですね。 結構最近では検索AI使ってるよという人も増えてきたと思います。
ここで言っている検索AIっていうのは従来のキーワードベースの検索ではないものとなります。 例えば今までであればカレー、レシピなどのキーワードで検索をしていました。
ですが検索AIになってくると会話ベースでAIに質問検索をすることができます。 例えばチキンを使ったカレーのレシピを教えてください。人数は2人分でお願いします。
こんな感じで会話をするように検索ができるものを検索AIというふうに呼んでいます。 このPerplexityにはAPIというのもあります。
このAPIというのは簡単に言うとプログラムからPerplexityにアクセスできると。 これを聞くとですねいやいやパソコン画面を開いたら手動ですぐにPerplexityを使えるので
APIを使う意味あるのと思う方もいると思います。 ただですねAPIを使うことで24時間自動でPerplexityを稼働させるようなことができるようになります。
なので日常的に情報収集とかあと調査のタスクがある人っていうのはAPIを使うことで このタスクっていうのをある程度自動化することができます。
今日はそのAPIについての話となります。 もともとPerplexityってAPIあったんですよね。
前のモデルがですねラマ3.1ソナーというモデルでした。 これ名前からわかるようにメタフェイスブックの会社が開発している
オープンソースのモデルラマというものをベースにしたものです。 以前このポッドキャストでも取り上げたと思うんですけどこのラマ3.1ソナー
パープレキシティのAPIですね 使ってみたんですけどあまり精度が良くなかったんですね
具体的に言うとあのパープレキシティのチャット画面で検索をしますよね あの画面で検索した結果とあとはAPIで検索した結果と比較すると結構精度が
落ちているとあのAPIの方がですね 利用する方としては期待するじゃないですか
パープレキシティのチャット画面と同じような検索結果がAPIでも出てくると ただ実際に利用したところ同じような結果にならないっていうことが多かったん
ですね なのでパープレキシティのAPIの導入を断念したという経緯があります
でちょうど先週ぐらいですかねパープレキシティから発表がありまして 新しいAPIのモデルをリリースしたと発表がありました
でこれがソナーとソナープロという2つのモデルとなります 結論先に言うと回答精度いいですね
AIを使った情報収集
あの以前みたいなチャット画面と大きく回答精度が異なるみたいなことはないなと 感じました
ソナーとソナープロという通常版と上位版のようなモデルですね ちなみにAPIの料金がソナーがまず入力トークンが100万トークンあたり1ドル
で出力トークンも同じ1ドルですね あとは1000回の検索あたり5ドルがかかってくると
で上位版のソナープロ ソナープロになると入力トークンが3ドル100万トークンあたりですね
で出力トークンが15ドルです で1000回の検索あたりがこれも同じく5ドルですね
でチャットGPTのGPT4.0をAPIで利用した場合っていうのが 入力トークンが2.5ドルでアウトプットが10ドルなのでそんなに価格の差はないと思います
入力と出力以外に1000回の検索あたり5ドルが追加される点がまぁちょっと違うかな という点ですね
でこれAPIを利用した場合っていうのは使った分だけ課金されるわけですけど
パワープレキシティプレイグラウンドというお試しの画面があります そちらであれば無料でこのAPIを試すことができます
このプレイグラウンドのリンクは概要欄に貼っておきますので 興味のある方はぜひチェックしてみてください
こんな感じで情報収集や調査にAIを使っている人っていうのは結構増えていると思います
で私もAIをあの情報収集のタスクで活用したりしています で以前はですねAIに情報収集をさせるっていうのはあまり良いアプローチではなかったんですね
なぜならAIには知識のカットオフという概念があるからですね AIはある一定までのあの情報しか学習していないというわけです
なので最新の質問には回答ができませんでした 例えばですねパワープレキシティのAPIモデルは何ですかと質問をしたら
あの今日ポッドキャストで話している最新のSONARのモデルについて回答ができないというわけです
でChatGPTを例にとるとChatGPTのGPT-4-Oの知識のカットオフが2023年の10月ですね
つまり2023年10月以降の情報については基本的には回答ができないというわけです
こういったこともあって情報収集にAIを使うっていうのはあまり良いアプローチではなかったわけです
ただちょっと事情が変わってきましてそこからインターネット上の情報を参照してAIが回答するというものが出てきました
もともとAIのモデルが学習しているものだけではなくてインターネット上の情報も参照して回答すると
でこうなってくるとですね知識のカットオフっていうのはあまり意識せずに良くなってきたわけです
最新の質問も回答できるようになったと
例えば最近リリースされた2024年の10月でしたかね
ChatGPT Searchというものがあります
でこれはインターネット上の情報参照してChatGPTが回答できると
これ無料ユーザーも2024年の12月からちょうど先月ですかね
先月から利用できるようになったので結構利用している人っていうのも多いと思います
で最近はこの検索AIの精度もどんどん上がってきたので実務で利用しているという人も増えてきたと思います
結構検索AI系のサービスっていろいろあるんですね
ちょっと一旦まとめるとですねまずChatGPT Searchですね
で次にCloud Searchと言いたいところなんですけど
CloudはAI検索のような機能っていうのは現時点ではありません
でジェミニですね他で言うとChatGPT Search、ジェミニ
あとは先週ポッドキャストで紹介したジェミニディープリサーチですね
でそれ以外で言うと今回ポッドキャストで話しているパープレキシティ
あとは中国のジェンスパークそして日本のフェローですね
でこの日本の検索AIのフェローっていうのは過去にこのポッドキャストで中の人にご出演をいただいてインタビューをしました
であとはですね他にもいろいろあるんですけど主要な検索AIのサービスっていうのはこんな感じでしょうか
ChatGPT Search、ジェミニ、ジェミニディープリサーチ、パープレキシティ、ジェンスパーク、フェローですね6つですね
でどうでしょうか以前に比べてAIを使った情報収集の武器っていうのが揃ってきた感じはしませんか
今回のパープレキシティのAPIしかり最近公開されたジェミニのディープリサーチしかり
以前よりですね情報収集の武器が揃ってきた感じはあります
でツールの数も増えてきたしあとは単純に検索の精度っていうのも上がってきています
ちなみに現時点で私が使っているのは日常の検索はフェロー
ファクトチェックの活用
であとは情報を深掘りして調査したいときはジェミニディープリサーチを使い分けています
で今回パープレキシティのAPIも出てきたので情報収集の自動化処理のワークフローに
パープレキシティのAPIも組み込めるようになったというわけです
ちなみに以前フェローさんにインタビューをしたときにフェローはAPIも開発をしていて
2025年の春ぐらいですかねあと多分もう少しだと思うんですけど
フェローのAPIも個人向けに公開するというふうに話されていました
そちらも個人的には楽しみですねフェローからAPIが出たらちょっとぜひ使ってみたいですね
でこんな感じで検索AIって調べ物に活躍してくれるんですけどちょっと他の使い方というのもできます
それがですね検索AIを使ってファクトチェックを行うというものになります
例えばある報告書があると目の前にですね
それは生成AIが作成した報告書でもいいし人間が作成したものでもいいんですけど
全文を検索AIに投げてファクトチェックをしてもらうと
つまり書かれている内容と後はインターネット上の情報を参照して内容に誤りがないか
AIにチェックしてもらうというアプローチになります
結構これ簡単なプロンプトでも動きましてちょっと一例を挙げますね
プロンプト読みますね
ユーザーが添付したテキストをインターネットの情報参考にファクトチェックしてください
誤りの可能性があれば理由とセットで指摘してください
そしてテキストを添付するとこんな感じの簡単なプロンプトでも動作します
でやっぱりAIを使っているとハルシネーション問題がありますよね
AIが間違った回答を出力してしまうと
テキストに書かれた情報に誤りがあるかどうかっていうのを検索AIを使ってファクトチェックすると
こういったアプローチも面白いと思います
で元々これジェミニに搭載されていた機能なんですね
これ意外に知らない方多いんですけどちょっと説明しますね
ジェミニでAIに質問して回答が出てきますよね
であの回答の下の方にですね再確認というボタンがあります
でこれを押すとジェミニが生成した回答っていうのをジェミニ自身がチェックしてくれると
インターネット上の情報と照らし合わせてその内容に誤りがないかっていうのをチェックしてくれるという機能です
で問題ない箇所っていうのは緑のマーカーで表示されます
逆に問題の可能性がある箇所っていうのは赤のマーカーで表示されます
これ結構便利なんですよね
でこれにヒントを得まして別にファクトチェックするのはジェミニじゃなくてもいいんじゃないということで
フェローとかあとパープレキシティとかチャットGPTサーチを組み合わせてファクトチェックするっていうのも面白いと思います
ちなみにこのファクトチェックする場合っていうのもフェローがおすすめですね
ちょっといろいろ試してみたんですけどフェローが個人的には出力の精度が良いと思っています
例えばチャットGPTが生成した回答をフェローでファクトチェックする
チャットGPTが生成した回答をパープレキシティでファクトチェックするとこういった使い方になります
でその他の使い方で言うと現時点で問題ない文章っていうのもありますよね
現時点では情報があのちゃんと間違ってないけど未来では誤りがある可能性の文章っていうのもあると思います
例えばわかりやすい例で言うとそうですね
例えば私がチャットGPTサーチに関する資料をまとめたとします
でこれ以前は有料ユーザーしか使えなかったわけですね
でも今はチャットGPTサーチは無料ユーザーも使えるようになっています
で私がこのレポートを作成した時点では
チャットGPTサーチは無料ユーザーは使うことができませんとと書いていたとします
その執筆時点ではそれが事実だったとしても将来的に内容が変更することっていうのはありますよね
特にAI関連のことになると情報の変更っていうのは結構頻繁に起こっています
でこれをファクトチェックを通すと
矢野さんと現在ではチャットGPTサーチは無料ユーザーも使えるようになってますよと
訂正しましょうと間違いを発見できるわけですね
でこれって結構あのブログとかあのそういったテキストコンテンツでも応用が効くと思います
で私ノートでブログも書いてるんですけどAI関連のですねブログも書いてるんですけど
やっぱり時間の経過とともに情報が古くなってくるというパターンもあると思います
でこうした情報の整合情報のチェックっていうのを検索AIを使って検出をしていくと
でそれこそあの今回のエピソードで話しているパープレキシティのAPIを使えば自動化ができますよね
コストはもちろんかかってくるんですけど人間が目視で一記事ずつチェックするよりも
遥かにコストも手間も圧縮できると思います
こんな感じで検索AIっていうのは情報収集以外にもこういったの情報のチェック
ファクトチェックにも使えるので興味のある方はぜひ試してみてください
オープンAIのオペレーター
はいまああの検索関連はちょっとここまでにしてここからはオープンAIからリリースされた
オペレーターについて話したいと思います
オペレーターはですねあの冒頭でもお伝えしたんですけどブラウザ版のAIエージェントのようなものですね
ブラウザを操作してAIにタスクを実行させると
こちらもですね先週公開されました先週ですね
ただ冒頭でお伝えしたように現時点では日本ユーザーは利用できません
利用条件がですねアメリカで利用できることあとはChatGPTのプロプランで利用できると
あのあれですね月額約3万円のサブスクリプションプランですねChatGPT Pro
でオペレーターを使うとChatGPTとは別の画面になるんですけど
ChatGPTにテキストで指示をしてブラウザ操作ができるようになるというものになります
これあの実際にオープンAIの公式がYouTube動画を出しているのでちょっとリンクを貼っておきます
デモ動画ではこのオペレーターを使ってブラウザを操作してレストランの予約をしたりとか
あとはオンラインショッピングのタスクっていうのを実行しています
実際に動画を見てみるとですねあのオープンAI公式とか
あとは他の海外ユーザーがアップしたものっていうのを見ると現時点では実用に耐えるものではないですね
結構ミスも多かったりあとは完了できないタスクがあったりしました
ただこれを見て私はGPT 3.5を思い出しました
あのGPT 3.5って遥か昔のような気もするんですけどChatGPTの初期のモデルですね
でGPT 3.5を使ったことがある人っていうのはあの感じていたと思うんですけど
GPT 3.5って実務に耐えるような精度ではなかったんですね
AIってすごいなと人間とAIが自然に会話ができるって思いつつも
まぁとはいえ実務で利用するにはまだまだ精度が足りないなと感じていました
ただGPT 4あたりからちょっと風向きが変わってきて
これは仕事でも使えるぞというふうになっていったわけです
それとちょっと似たような感じをこのオペレーターを見て思いました
現時点では確かにオペレーターはすごくてワクワクするような機能なんですけど
じゃあこのオペレーターを使って仕事ができるか業務効率化ができるかって言うと
まぁ現時点ではですねちょっと無理かなと
そもそもオペレーター自体が現時点ではプレビュー版の段階ですからね
これがGPT 3.5と同じように性能がどんどんアップして仕事で使えるようになるのか
もしくはこのまま遅ら入りするのかっていうのはちょっと現時点ではわからないんですけど
GPT 3.5の時のようにその時点では使えないと思っていたものでも
性能がアップして使えるようになるっていうケースは全然あるので
オペレーターが今後どのように進化していくのかっていうのは引き続きチェックしていきたいと思います
将来的にはプラスユーザー月額3000円ですかね約3000円
プラスユーザーにも使えるようにすると発言しているのでプロプランでなくてもですね
3枚のプロプランでなくても利用できるようになる可能性っていうのはあると思います
ちなみにこのオペレーターですけどコンピュータユージングエージェント
頭文字を取ってQUAと呼ばれる新しいモデルで動作をしています
このQUAのAPIっていうのも近日中に公開されるという話もあります
つまり開発者がQUAのAPIを使って独自のブラウザーエージェント
そういったアプリケーションを構築できるようになるとこっちもですねちょっと楽しみですね
海外のユーザーの報告を見ていると オペレーターであのスプレッドシートの操作ができたと報告があったので
ちょっと早く使ってみたいですね こんな感じでブラウザーを自動操作するプロダクトっていうのは
結構AI各社が力を入れてきています まずオープンAIのオペレーターですね
あとはGoogleのプロジェクトマリナー あと以前クロードが公開したコンピュータユーズですね
業務の中で人間に代わってAIに任せてもいいタスクって結構あると思うんですよね
そうした単純作業がオペレーターのようなプロダクトが解決してくれたらありがたいですよね
どうでしょうか2025年中に出てきますかね 現時点での性能を見るとちょっと厳しい感じはします
まあこれもですね2025年の楽しみということで もしかすると2025年の後半とか末に
かなりの精度でブラウザーを操作できるAIエージェントが公開されるかもしれないですからね
ブラウザ版AIエージェントが今後どうなっていくのかっていうのは引き続きチェックしていきたいと思います
SONARモデルの登場
はいでは今日のポイントをまとめます 1つ目にPowerPlexity APIから新しいモデルのSONARがリリースされました
以前のモデルに比べて格段に回答性能が上がっています このPowerPlexityのAPIについてノートで記事を書きましたので
興味のある方はぜひあの概要欄にリンクを貼っておきます 2つ目に検索AIの性能というのはどんどん上がってきています
情報収集のタスクでAIを活用するのがおすすめです 個人的に使っているのは日常の検索はフェロー
そして深く調査をしたい時には最近リリースされたGeminiのディープリサーチがおすすめです そして3点目
オープンAIからオペレーターというブラウザー版のAIエージェントがリリースされました AIに指示をしてブラウザ上のタスクを実行できます
ただし現時点ではアメリカのみで利用には月額約3万円のプロプランに加入する必要があります
はい今日はこの辺ということで本日も聞いていただきありがとうございました 今回PowerPlexity APIの話とあとあのオペレーターの話をしましたけど
実はもう一つあるんですよね ちょっと時間があれだったのであえて外したんですけどちょっとだけ補足をすると
パープレキシティからリリースされたパープレキシティアシスタントというものですね ちょっと公式の説明を引用しますね
パープレキシティアシスタントのご紹介 パープレキシティアシスタントは推論、検索、アプリを使用して簡単な質問から
複数のアプリの操作まで日常のタスクを支援します ディナーを予約したり忘れた曲を探したり
車を読んだりメールを下書きしたり リマインダーを設定したり様々なことができます
Google Playストアで入手可能 これ残念ながらあのiOSでは使えないんですけど
Androidユーザーの方はチェックしてみてはいかがでしょうか もう一つ公式の説明を引用しますね
パープレキシティアシスタントの使用を開始するには パープレキシティアプリを最新バージョンに更新し
ホーム画面のバナーをタップして手順に従ってください またデバイスのアシスタント設定からいつでもアシスタントを管理できます
Androidで利用できるパープレキシティアシスタントですね Androidユーザーの方はぜひチェックをしてみてください
番組ではこのように耳で学べるAIを毎週発信しています 通勤中や火事の合間にAI情報をキャッチアップできます
毎週水曜朝に更新していますのでぜひフォローをお願いします おすすめの生成AIツールをまとめた資料も配布しているので興味のある方はこちらもぜひ
概要欄にリンクを貼っておきます お相手は耳で学ぶAIの矢野てっぺいでした
また次の配信でお会いしましょう
22:49

コメント

スクロール