1. 耳で学ぶAI、ロボシンク
  2. #50 2024年AIの振り返り。Open..
2024-12-25 23:34

#50 2024年AIの振り返り。OpenAI, Google, Anthropic, Meta, Amazon, Microsoft, Appleの動向

✍️内容

2024年最後のポッドキャストということで生成AI各社の気になる動向をまとめます。

ChatGPTやGemimi、ClaudeをはじめAmazonやMeta、Appleなどの動向についても触れます。

AI各社の動向をチェックしたい人はぜひ聴いてみてください。

---

生成AIのニュースレターを始めました🎉 AIの最新情報や知見を効率よくキャッチアップできます。

登録はこちらから→⁠⁠https://bit.ly/3Cq9LDG

---

🔗リンク

◎12 Days of OpenAIまとめ(note)

⁠https://note.com/robothink/n/n8b06e8bfdaad

---

「耳で学ぶAI、ロボシンク」ではChatGPTやGemini、Claudeなど生成AIを初心者向けに分かりやすく解説します。

---

👨‍💻パーソナリティ: 矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。

◎note
https://bit.ly/3LvtP91

◎X: 矢野哲平
https://bit.ly/3Tx6maM

---

📩番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787

サマリー

2024年のAI業界を振り返り、OpenAI、Google、Anthropic、Meta、Amazon、Microsoft、Appleの動向について詳しく解説する。特にOpenAIの新機能SORAやChatGPT Search、O3モデルのリリース、GoogleのGeminiの進展が注目される。また、MetaのオープンソースAI「ラマ」や、AmazonのAIモデル「Nova」の登場など、各社の戦略が明らかになる。

00:08
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者、中級者向けに、AIを分かりやすく解説する番組です。
今回のテーマは、2024年AIの振り返り、AI各社の動向について話していきます。
はい、ということで今日は、2024年の総集編ということで、主要なAI各社の動きについて、振り返りながら話していきたいと思います。
OpenAI, Google, Anthropic, Meta, Amazon, Microsoft, Appleですね。合計7社ですね。
一つずつ詳しく掘り下げていくと、かなりのボリュームになってしまうので、重要なトピック、気になった点を中心に振り返りたいと思います。
AI各社の動きをですね、把握したい方は、ぜひ最後までお付き合いください。
OpenAIの進展と新機能
はい、それではまずChatGPTのOpenAIからいきましょうか。 やっと終わりましたね。
12 Days of OpenAIイベントが終わりました。 これですね、12月6日から12日間毎日、新しい情報を発表するという
OpenAIのイベントが開催されていました。 この中でいろいろな機能というのが発表されました。
12個すべてこのポッドキャストで話すのは、ちょっと時間がかなりかかってしまうので、3つに絞ってお伝えしたいと思います。
それ以外のトピックについては、ノートにですね、12日間全部の発表をまとめた記事を書いているので、全部網羅したい人はそちらをチェックしてみてください。
概要欄にリンクを貼っておきます。 今回のですね、12日間のイベント、いろいろ発表されたわけですけど、私個人としては気になるトピックはこの3つになります。
まず1つ目に動画生成AIのSORAが発表されたこと。 そして2つ目にChatGPT Searchの無料ユーザーへの公開ですね。
そして3点目にO3というモデルが発表されたことになります。 ちょっと一つずつ話していきますね。
でまずSORAから行くと、これはですね、OpenAIの動画生成AIのサービスですね。 もともと2024年の前半に公開されました、あのデモ動画みたいなものが
公開されたんですね。 当時動画生成AIいろいろあったんですけども、その中でもですね、
群を抜いて精度が良かったので一時期話題になりました。 でそれからSORAがですね、一般公開されるまでちょっと時間が空いてしまったんですけども
2024年の12月にやっと一般公開されたというわけですね。 私も実際に使ってみました。かなり精度が高いですね。
かなり精度が高い動画が生成されます。 ちなみにですね、この動画生成AIのSORAはプラスユーザーから利用することができます。
動画生成に興味がある方はですね、一度触ってみることをお勧めします。 次にChatGPT Searchについて触れたいと思います。
これですね、少し前にChatGPT Searchという機能が有料ユーザー向けに公開されました。 チャット上からインターネットの情報を参照できるというものですね。
もともとChatGPT自体にはですね、ブラウジング機能というのがあります。 これはですね、インターネットの情報を参照できるというものですね。
ただですね、このもともとあるブラウジング機能っていうのはあまり精度は良くなかったんですね。 ただ今回この公開されたChatGPT Searchというのはそれの上位互換ということで
かなり精度が上がっています。そして今回の発表で無料ユーザーにも使えるようになったと。 これですね、すごく便利なんですよね。
いろいろ検索AIのサービスはあります。 ただですね、ChatGPT上でかなり高度な検索ができるっていう風になるとかなり使い勝手が
グッと良くなるんですね。 例えばですね、ビジネスのアイデア出しをするタスクをちょっと想像してみてください。
で、ChatGPTと会話をしてビジネスアイデアっていうのを出しますよね。 で、その会話の流れの中でですね、
ではこのビジネスアイデアの競合を調査して、みたいな感じでそのままスムーズにChatGPTに競合の調査が依頼できるんですね。
これですね、結構便利なのでChatGPT Searchまだ使ったことがない方は是非使ってみてください。 ちょっと余談なんですけど、私がChatGPTでアイデア出しをする時によくやっている
流れっていうのをちょっと紹介しますね。 まず頭の中にビジネスアイデアがあったり、ビジネスの戦略があると、そういった時にですね
まずChatGPTにその自分が考えている頭の中にあるビジネスアイデアというのを説明します。 そしてそのビジネスアイデアを評価してもらうという流れですね。
例えばプロンプトはですね、あなたはシリコンバレーの投資家ですと。 投資家目線でこのビジネスアイデアの良い点と悪い点を評価してと。
で最終的にこのビジネスアイデアに投資するかどうかっていうのを理由をつけて回答してと。 つまりですね
ChatGPTに投資家として振る舞ってもらって、人間はChatGPTに対して自分のビジネスアイデアを披露する、 プレゼンするというような流れになります。
で大体ですね、この流れで言うとChatGPTは黒票してきます。 投資しないと、そんなビジネスアイデア投資しませんよと。 大体ビジネスアイデアに対してケチをつけてくるんですね。
で次にですね、じゃあ今度はシリコンバレーの連続起業家として振る舞ってくださいと。 あなたならこのビジネスアイデアをどのようにブラッシュアップしますか
どのように改善しますか、改善案を教えてというふうに伝えます。 この時にですね、ChatGPTのモデルをGPT4やO1と切り替えたりするのもおすすめです。
そうすると今度はChatGPTがビジネスアイデアの改善案というのを提案してくれます。 その最終的に出たアイデアに対して、じゃあそのまま競合調査を行ってくださいと。
競合となり得るサービスはありますか。国内海外の事例を検索してというような感じですね。 こんな感じでアイデア出しに限らず、会話をですね
一往復で終わらせるわけではなくて、会話を重ねてどんどん掘り下げていくっていうのがおすすめです。 なぜなら会話自体がプロンプトになるからですね。
会話自体がコンテキスト、文脈や背景情報となってそのままAIに渡されると。
AIはコンテキストが充実しているほど回答の角度と言いますか、精度が上がるのでおすすめです。
はいすいませんまたちょっと脱線してしまいました。 今度はですね最後にO3のモデルの話となります。
12 Days of OpenAIの最終日に発表されましたね。 すでにあのO1というモデルが公開されていますけど
これの次世代モデルというわけですね。O3。 普通だったらO1の次はO2なので、O2モデルかなと思いますが
ちょっと今回はですね、O2を飛ばしてO3という名称になっています。 これちょっと余談なんですけど
O2っていう名称が確かスペインでしたかね。 スペインの通信事業者が保有しているサービス名称でO2というものがあるらしいですね
なのでO1から飛んでO3と命名されたというわけですね。 でこれ簡単に言うとですね
O1モデルのパワーアップバージョンとなります。上位互換ですね。 推論やプログラミング、あとは数学など専門的なタスクに優れていると。
ただですね、今回のこの発表っていうのはあくまで発表だけに留まって、 まだ一般ユーザーは使えないんですね
O3モデルとO3 miniというモデルの2つが発表されましたけど、まずはですね
O3 miniのモデルから2025年の1月末から公開予定とのことです。 なのであと1ヶ月後ちょっとぐらいから
O3 miniから公開されていくという予定だそうです。 ちなみにですね
AGIのベンチマークにArcAGIというものがあるんですけど、 これであの最大87.5%のスコアを達成したと
でこれちょっとわかりにくいんですけど、人間の平均が85%ぐらいらしいんですね。 なので人間よりもスコアが良いと
かなり性能はいいんじゃないかというふうに言われています。 ただですねこのO3 miniとあとはO3ですね
どのプランで利用できるかっていうのはまだ明言されてないですね。 なのでもしかすると月額3万円のプロプランかもしれませんし
月額3000円のプラスプランかもしれませんし、 どっちなんですかね
このすごいモデルがですね、いくらで使えるのかっていうのはちょっと気になるところではあります。
GoogleのGeminiの躍進
はいえーでは次にGoogleですね。 Googleが開発するGeminiの話ですね。 以前までGeminiといえばあのチャットGPTや
あとはクロードの会社アンソロピックですね。 に比べて精度が低いというふうに言われていました。
ただ2024年を振り返るとですね、かなり巻き返しを図ってきたと思います。 チャットボットアリーナっていうAIの比較サイトがあるんですね。
人間の目でAIモデルがどっちが優れているのかっていうのをチェックする ランキングサイトがあるんですけどこのチャットボットアリーナで
オープンAIやクロードを抑えて1位に輝いたっていうのも印象的でした。 以前まではそういったことなかったんですけど
2024年はですね大躍進の年だったと思います。 あとGemini 2.0 Flashも12月に発表されました。
これまだあの実験的なモデルなんですけども 2025年には正規版も出てくるんじゃないかなと思います。
Gemini 2.0のモデルですね。 これの特徴の一つにストリームリアルタイムというのがあります。
これ簡単に言うとですね、リアルタイムに音声会話をしたり、AIとですね、 ユーザーのパソコン画面をリアルタイムに共有しながらタスクをこなせるというものになります。
つまりですね、AIと手元のパソコンの画面を共有しながらですね、 この問題は何とかこのパソコン画面でどう操作したらいいのとかですね
そういったものをAIとリアルタイムに会話をしながらタスクをこなしていけるというものですね。 この機能に関してはGeminiのチャット画面ではまだ利用はできません。
ただですね、Google AI StudioっていうGeminiの実験環境のようなところがあるんですけど、 こちらからはもうすでに試せますね。
実際に私も試してみました。 正直に言うとですね、まだ実用レベルかと言われるとそうでない部分もあります。
ただですね、AIと画面を共有しながらこのページで説明していることはとかですね、 そういったことをリアルタイムに質問できるっていうのは面白い体験ですね。
Anthropicのクロードのリリース
この機能もですね、ちょっと正規版が出てくるのは楽しみですね。 次はアンソロピック、クロードというAIを開発している会社ですね。
オープンAI、Google、アンソロピック、これがのAIの誤算家とか言われたりするんですけど、 国内でも人気のモデルですね。
今年はクロード3.5ソネットとハイクというモデルをリリースしました。 クロードにはですね、もともと3つのモデルがあります。
上から性能順にオーパス、ソネット、ハイクですね。 で、2024年はですね、クロード3.5ソネットとハイクが2024年の後半にリリースされました。
中位のモデルのソネットと、あとは一番下のモデルのハイクがリリースされたわけですね。 で、あの最上位のオーパス、クロード3.5オーパスっていうのは今年リリースされませんでした。
なので、クロード3.5オーパスは2025年に持ち越しですね。 ただですね、やっぱりクロードを使いやすいですね。
自然な文章作成のタスクとか、あとは日本語のタスクでは、ちょっとやっぱりクロードが他のモデルに比べて強いのかなと思います。
あとはコーディングのタスクでもクロード3.5ソネットは活躍してくれます。 前回、アメリカのAIスタートアップのCreateXYZの方にインタビューをしたんですけど、
アメリカのAIスタートアップのチームもですね、クロード3.5ソネットを開発に使っているというふうに言っていました。
やっぱりですね、コーディング関連強いですね。 アンソロピックはオープンAIやグーグルとはちょっと違う路線を進んでいるような印象も受けます。
あの結構画像生成とか動画生成ってオープンAIとかグーグルは手を出してますよね。 ただアンソロピックは画像生成も動画生成も手を出してないですね。
あとはインターネット検索も実装してないですね。 そういった面で見るとちょっと違う路線を進んでいるように思います。
どちらかというとエンタメ寄りのものではなくて、純粋に業務にフォーカスしたプロダクトを開発している印象です。
パソコンを操作する機能なんかも発表しましたよね。 今後アンソロピックがどういった方向に進んでいくのかっていうのは非常に興味深いですね。
はい次はメタ行きましょう。元Facebookという名前の会社ですね。 Facebook、Instagram、あとはThreadsを提供している会社でもあります。
メタはですね、ラマというAIのモデルを開発しています。 オープンAIや他の会社と異なる点というのは、このラマのモデルですね
オープンソースで提供しているんですね。 誰でも使ってくださいと、あの無料で使ってくださいと。これも結構衝撃的ですよね。
ラマを使ってローカルの環境で開発を進めると。 特にあの重要な情報を扱う業務では結構ラマの利用も増えているようですね。
一般的にはですね、ラマを使う機会っていうのはあまりないとは思います。 メタも独自の路線、オープンソースでAIを攻めていくという戦略を取っています。
アマゾンのAIモデル「Nova」
はい、次はAmazonですね。 Amazonというと、Amazonショッピングの印象が強いと思います。
でもですね、実はAmazonもAIを開発しているんですね。 一番直近だとAmazon NovaというAIモデルを発表しました。
NOVAと書いてAmazon Novaですね。 これがちょうど12月の話ですね。これですね、すごいんですよね。
何がすごいかっていうと、コストの安さですね。 ChatGPTとかGeminiのAPIを利用する場合って、利用した分に応じて料金がかかるんですね。
このAPIっていうのは、プログラムからChatGPTとかGeminiのモデルにアクセスするようなものですね。
例えば、私がですね、英語の動画の字幕を日本語に翻訳するツールっていうのを作ったとします。
海外の英語の動画がありますよね。 それを日本語に翻訳してくれるようなツールですね。
この時にChatGPTのモデルを使うか、Geminiのモデルを使うか、もしくはCloudのモデルを使うかって、色々選択肢があって悩むわけですね。
こういった時に、利用料金、APIの利用料金と、あとはその精度ですね。 回答の精度っていうのを見比べて、この場合だと翻訳の精度ですかね。
を見比べて一番良いモデルっていうのを選択する必要があるわけですね。 で、この色々あるAPI、色々あるAIモデルのAPIの中で一番コストが現時点でですね
安いのはGoogleのGeminiと言われていました。 具体的にはGemini 1.5 Flash 8 Billionというモデルですね。
でもですね、ここに来てAmazonが低価格かつ性能の高いAIモデルを投入してきたというわけですね。 それがAmazon Novaというわけです。
ちなみにですね、Gemini 1.5 Flash 8 Billionよりも少しだけ安いですね。 でも元々ですね、GoogleのGemini 1.5 Flash 8 Billionがですね
かなり他よりも安い価格設定だったんですね。 で、それをAmazonはさらに上回ってきたと。あの価格でですね、安い価格を提供してきたと。
で、私も実際にAmazon Novaを使ってみました。 英語の動画の字幕ですね。それを日本語に翻訳するタスクで使用をしてみました。
結論言うとですね、Gemini 1.5 Flash 8 Billionの方が精度が良かったです。 このタスクにおいてはですね。
なのでGemini 1.5 Flash 8 BillionからAmazon Novaに乗り換えるっていうのは見送りました。 結果的に。ただですね、可能性を感じるAIモデルだと思いました。
日本語のプロンプトも普通に通りますしね。 Amazon Novaっていうのは上から順にですね、Pro、Lite、Microのモデルがあります。
で、2025年の初めには最上位のPremierっていうモデルもリリース予定だそうです。 一応ですね、どちらかというとこのAmazon Novaは開発者寄りに提供されているそうなんですけども
一般ユーザーにもChatGPTみたいな形で公開される可能性っていうのもあるかもしれないですね。 なので今私たちが使っている選択肢はChatGPTか
GeminiかCloudの3択だと思うんですけど、これにもしかするとAmazon Novaも入ってくるかもしれないですね。
マイクロソフトとAppleのAI戦略
はい次はマイクロソフト。マイクロソフトはですね、ちょっと違うアプローチというか AIエージェントがキーワードになると思います。
自立型AIへ舵を切っていますね。 AIの本格的なビジネス活用を推進しています。
従来のチャットボット、人間の質問に答えるだけのAIというものを脱却して、AIが自分で考えてタスクをこなしていくと。
そういった自立型のAIエージェントをマイクロソフトのいろいろなプロダクトに組み込んでいくと。 例えばですね、Teamsっていうマイクロソフトのプロダクトがありますよね。
チャットやビデオ会議ができるようなプロダクトですね。 このTeams内に専用のAIエージェントがいて、会話を参考にですね、議論に参加してくるわけですね。
AIが。これはやっぱり今までとは違うアプローチですよね。 例えばリモート会議なんかでAIを使うと、そうした場合っていうのは例えば会議後の内容を
要約したりとか、あとは文字起こしをするという内容に留まっていたと思います。 これがマイクロソフトのプロダクトになると、AIが自立的に会議に参加をしてくると。
これもですね、これからどういったふうに進化をしていくのかっていうのは楽しみですね。 はい、最後はAppleですね。ITの巨人Appleです。
AI界隈って、もともとオープンAIがワーッと出てきて、その後Googleが追って。 その時もですね、Appleは動かなかったんですね。
2023年とかですかね。 裏側で動いてたとは思うんですけども、他社に比べてAIの取り組みが遅いという印象がありました。
オープンAIとかGoogleとかマイクロソフトに比べてですね。 ただ2024年の3月でしたかね。今年の3月
Titanっていう自動運転のプロジェクトがあるんですね。Appleの。 これが10年ぐらい動いているプロジェクトなんですけど、それをクローズしたわけですね。
そのプロジェクトに割いていた約2000人ぐらいの人員をですね、 生成AIの開発部門へ配置転換したと。結構AppleがAIに本腰を入れてきたと。
そしてですね、2024年の10月にApple Intelligenceというものを発表しました。 iOSとかMacとかiPhone、そういった
Apple製品の中にAIを組み込むというものですね。 時系列で言うと、2024年10月にアメリカで提供開始をして
12月から英語圏への拡大。日本はですね、2025年の予定というふうに言われています。 一応ですね、日本でも端末の、例えばiPhoneとかありますよね。
iPhoneの端末の言語を英語に設定して、あとはウェイトリストの登録をすれば日本でも 使えるみたいな情報は見ましたけど、
とりあえず通常の設定では、現時点ではまだ日本ではApple Intelligenceは使えないと。 こんな感じでAppleはですね、
ChatGPTのようなチャット画面がありますよね。 そういったサービスではなくて、Apple製品の中にAIを組み込んでいくと。
具体的には画像生成とか文章作成支援とかですね。 こうしたアプローチって、やっぱりAppleにしかできない戦略ですよね。
私もApple製品を使っているので、Apple Intelligence使えるようになるのが楽しみです。 はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。
ちょっと話は変わるんですけど、前回アメリカのAIスタートアップですね、 CreateXYZ様にインタビューをしました。
で、そのポッドキャストを公開した後にですね、リスナーの方からコメントをいただきました。 ありがとうございます。ちょっと読ませてもらいますね。
本日もAIの話を楽しく聞かせていただきました。 Apple Podcasts Web版で聞いています。
ポッドキャストの内容をボイスレコーダーに録音して、 ノートブックLMにAIの未来というフォルダを作って、他のAI情報と一緒に蓄積しています。
多数の情報を横断的に分析したりして楽しんでいます。 ありがとうございました。 こちらこそありがとうございました。
この使い方いいですよね。 あの、ノートブックLMっていうのはGoogleのAI搭載のメモアプリみたいなものですね。
効率的に情報の集約や収集がですね、できるのでおすすめです。 で、このノートブックLMの中にポッドキャストやその他のAI情報をどんどん集約していくと。
私もノートブックLMに情報集約して使っています。 コメントありがとうございました。
番組ではこのように耳で学べるAIを毎週発信しています。 通勤中や家事の合間にAI情報キャッチアップできます。
毎週水曜朝に更新していますので是非フォローをお願いします。 また、生成AIの最新情報をお届けするニュースレターも配信していますのでこちらも是非
概要欄にリンクを貼っておきます。 お相手は耳で学ぶAIの矢野てっぺいでした。
それでは、良いお年を。また次の配信でお会いしましょう。
23:34

コメント

スクロール