2025-12-28 13:42

人工知能・AIに関するニュース(2025年12月分)Podcast配信など

spotify apple_podcasts youtube

人工知能・AIに関するニュース(2025年12月分)Podcast配信など

詳しくはブログで↓

⁠⁠https://yokotashurin.com/etc/202512podcast.html

サマリー

2025年12月のAIニュースでは、ディープリサーチや新しい音声入力技術、クローラの進化、ノートブックLMなどの革新が取り上げられています。今年1年間でAIの進化が顕著に見られ、その内容が振り返られています。また、エージェントモードの進化やワークスペースでの新機能が発表され、特にGoogleやMicrosoftが注目されています。さらに、著作権問題に対する訴訟や新しい音声合成サービスの動向も取り上げられています。

AI技術の進化
皆さん、こんにちは。ネットビジネスアナリスト、横田秀珠です。1ヶ月に1回のPodcastの時間となりました。
今日もAIに関するニュース、12月分ということで、振り返っていきたいと思うんですが、今日は年末ということもありますので、今年1年間、AI業界がどんなに変わったのかということをですね、ちょっとまとめてね、話をしていきたいと思うんですね。
まず、大きい切り口として、入力ですね。AIにインプットさせる情報のところがどう変わってきたかという話からしていきたいと思うんですけど、まずですね、なんと気づいたらですね、びっくりなんだけど、ディープリサーチっていうのがチャットGPTに搭載されたのは、今年の2月なんですよね。
さかのぼると、去年の11月1日にチャットGPTサーチが追加になったことによって、入力モードとして、何か情報を、いわゆるチャットGPTの中に入っている知識ではなくて、GPTが検索をして、最新情報とかを拾ってきて、入力するということができるようになったんですね。
ディープリサーチはその典型じゃないかなと思うんですね。これはね、やっぱり今年、2025年の一番の大きい革命って言ってるんじゃないかなと思うのがディープリサーチじゃないかなと思います。もちろん、Googleは2024年の暮れからあったんですけどね。
あとは音声入力のとこにですね、Aqua VoiceとかSuper Whisperとかですね、あとVoice Inkみたいなですね、音声入力を便利にするというツールがいろいろ出てきましたね。これMacしか使えないものが結構多いんですが、あとはProud NotepadとかLimitlessみたいなですね、音声を24時間録音してですね、そのデータをもとに日記を作るとか何かするみたいなものが出てきた。
入力ベースは結構この辺変わったかなと思っています。あとは画像認識もかなり賢くなったんですけど、今回ちょっと省きました。ついでなんですが、その入れた情報に対して思考ですね、考えるIQの部分がどうなったかって話なんだけど、振り返るとすごいですよ。オープンAIは3月にGPT 4.5が出て、8月にGPT 5、そして11月にGPTの5.1、そして12月に5.2ということでめちゃくちゃ進化してますよね。
クロードの方ですね、これは3月に3.7が出まして、5月にクロード4、そして9月にクロードソネット4.5、そして11月にクロードオーパス4.5ということですね。これもすごい進化します。Googleも負けてません。3月にGemini 2.5 Proが、4月にGemini 2.5 Flashが出まして、11月にGemini 3、そして12月にGemini 3 Flashと出ましたね。
XAIの方もね、2月にGlock 3が出まして、7月にはGlock 4が出ましたね。このGlock 4が出た瞬間的には一時的にですね、世界一になったんですけど、すぐその後GPT 5抜かれちゃいましたが、知能指数は130から150近くまで上がったのがこの1年間で、そしてGPTのですね、プロモードで使えるものですね、プロっていうものがあるんですけど、このモデルが今まではですね、MAXプランという月3枚しか使えなかったのが、チームプランでも使えるようになりました。
これ引き下げになったっていうのが大きいかなと思っています。今度は出力ベースなんですけど、これもね、やっぱり結構大きいのはノートブックLMなんですよね。気づいてみれば今年1年間で音声解説ができるようになったのが、英語から日本語になったと。そして動画解説もできるようになったのが、英語から日本語も可能になったと。そしてインフォグラフィックもできるようになって、さらにはスライド解説もできるようになって、表形式もできるようになった。
これ全部今年起きたことなんですね。ノートブックLMの進化がやばいですね。さらには、フェローの方でも同じくインフォグラフィックとかですね、あとテキスト可視化図っていう機能とかですね、つきましたし、ジェミンのディープリサーチもですね、インフォグラフィック機能がついたりしましたよね。ということで、図解を使って説明するっていうものがかなり進化した1年じゃないかなと思いますね。
さらにはですね、今度、ラグというものがありまして、やっぱりこれはね、ノートブックLMは外せないと思うんですね。これしか出てないですよね、結局ね。何かインプットした情報に対してっていうのは、やっぱりノートブックLM、Googleのサービスが一興かなと思っています。もう1個はですね、クラウド連携が進んだ1年だったなと思っていまして、例えばチャットGPTであればですね、その連携でですね、例えばGoogleドライブとかGメールとかですね、ワンドライブみたいなもの、ドロップボックスとかですね、
ボックスみたいな形で、クラウドサービスと連携するGoogleカレンダーとかもできますね、というものが出ましたよね。Googleも同じようにですね、Googleは自分たちのサービスが中心ですけど、Googleワークスペースと連携するっていうことができるようになってきましたねということで、自分のですね、公開されてないクローズの情報にアクセスして何かするってことができるようになったっていうのはね、大きいかなと思いますね。
これは今年1年大きい変化かなと思ってますね。今度はですね、コンテンツ生成に行きますと、画像生成ですね。これOpenAIから出ましたGPT Image 1ですね。これあのジブリ風が出て話題になりましたのは今年の3月ですよね。その後8月にNanobanana、そして11月にNanobanana Pro、これ同じくGoogleですね。それに対抗する形で12月にOpenAIはImage 1.5を出しましたが、この辺ですよね。
グロックの方からも画像生成出ていますけど、ちょっと省略しました。動画生成の方は、気づけばこれ今年の5月にベオ3が出て初めて音声入りの映像が作れるようになって、そして10月のソラ2ですね。これかなり大ブレイクしましたけど、そしてGoogleはベオ3.1を出して追随してきました。
そしてですね、忘れちゃいけないのは、ノーラの進化もやばかったですね。今年1年間でいろんなことができるようになりましたね。対話型のものとかですね。自分のキャラクターを登録するとかですね。あとはショート動画、縦とか対応とかいろんなものが変わった1年だったかなと思います。
続いて音楽生成アイですね。SU-NOなんですけど、去年の12月ぐらいからSU-NO4になりまして、1月からなったのかな。12月のくれぐらいからになってると思うんですけど、4になりまして、そして4.5になって今5になってますねということで、これも音楽生成すごいアップグレードしました。
ただし、2026年はですね、このモデルを全部使えなくして、たぶん新しくSU-NO6になるんですかね。5.5になるのかわかりませんが、そこで今までの学習しないものに変わるので、これでどのぐらいクオリティが保てるかってことが非常に話題になってますね。結構忘れがちなのが、GoogleのGeminiのGemの中に入っているストーリーブックというですね、絵本生成ですね。
この機能は結構使えるんだけど、ここのアップデートちょっと期待してるんですけど、今のところまだ話は来てませんね。今度はですね、AIプラットフォームのタイトーも目まぐるしかったかなという気がしていますね。例えば、パークレシーはAIプラットフォームという言葉がちょっと微妙なんですけど、いわゆるAI検索としてですね、いろんなものと連携できてますね。
ジェーンスパーク、フェロー、スカイワーク、マナスという形で出てきましたね。マナスについてはまだね、深く解説をしてないんですけど、いずれちょっとやろうかなと思っていますが、こういうですね、いろんなAIが一つのプラットフォームで同時に複数使えるというものが出てきたのも、今年1年、AIが普及した背景にあるかなと思っています。今度はですね、AIエージェントというもので、例えばChatGPTにエージェントモードが追加になったり、
コンテンツ生成の革新
Copilotにエージェントモードが追加になったり、ジェーンスパークにもエージェントモード、そしてジェミーのジェムにもエージェントモードが入ってきましたねということで、一つのラージランゲージモデルですね、LMの中で自律的に何かをさせるっていうことができるようになってきました。今まではエージェントモードっていうのは外部サービスを使ってそこがやってたんだけど、本家本元がやり始めたと。
ジェーンスパークはちょっと違いますけど、というものが出てきたなって気がしています。ついでなんですが、ワークスペース、ここの進化も結構ありまして、例えばGoogleのワークスペースの中にもジェミニが標準搭載されてきましたし、Microsoftの365の中にもCopilotというのが標準搭載されるという発表になってますね。これ早ければ年内と言ってたんだけど、もう年末なので多分年明けぐらいになると思いますが、これが搭載されますねと。
ノーションAI、これもAIが入ったのは去年入ってますけど、今年さらにそこにメールとかカレンダーとか連携になってきましたので、ノーションの中で連携しているものに対して、いわゆるワークスペースの中でAIが使えるようになったっていうのは大きいかなと思ってますね。
個人的に注目しているのはAIチャットの実装なんですよね。例えばGoogleにはAIモードという形で、これ2025年9月から日本でも運用が開始していますし、検索エンジンのYahooのほうもYahooアシスタントというものがデフォルトで入りましたし、Amazonの中にはRufusという対話型生成が入りましたし、楽天市場も近日追加するという話。
年内とここも言ってたんだけど、ちょっとずれ込んでますが、その前に発見タブとか、画像の発見が、いわゆるInstagramの発見タブみたいなものが楽天市場に追加されましたが、次は対話型生成AI、チャットが導入されるって発表になってますね。
そしてGoogleマップの自分のお店の中にもAIチャット機能が実装されたし、LINEの個人のほうで使うほうにもAIがメッセージを考える機能が追加になりましたよね。LINE公式アカウントのほうにもAIアシスタントというAIがチャットボットで答えるっていうものがチャットプロオプションっていうプランで追加になりましたね。
さらにはリアルタイムのほうに行きますと、音声会話ですね。チャットGPTのいわゆるアドバンスボイスモードっていうのが、この1年でもめちゃくちゃ進化しましたね。さらにはリアルタイム文字起こしが画面に表示されるっていうところまで来ましたね。これかなりすごい進化でしたね。
そしてジェミニライブ。Googleのほうも負けてなくて、ジェミニライブっていうのがありますね。マイクロソフトのCopilotのほうもCopilot Voice、そしてGlockもGlock3、Glock4と音声会話できるようになったんですが、意外にまだ追いついてないのが映像会話なんですよね。テレビ電話って言ったほうがわかりやすいかもしれませんけど、これはGlock4がAnnieちゃんを搭載したことによってかなり話題になったんだけど、ここにはまだ他社があんまり追随してきていないという気がしてます。
ここが来年ですね、2026年は映像ベースのリアルタイム会話っていうのができるものを出してくると思いますね。これは期待したいところです。僕が注目しているところでは、CastTalkというサービスはすでに人物のリアルタイムの音声会話、映像会話っていうのができるようになっているサービスがありますね。これも注目だったですね。
そして著作権に関してですね、ジブリ風ということでオープンAIが出したGPD Image 1に対してかなり騒がれましたけど、その後ソラの方でも日本のアニメがたくさん使われて話題になりましたが、これは日本から抗議があってすぐ中止になりましたけど、一方でオープンAIはディズニーと提携しまして、2026年はディズニーの作った著作物をソラで使えるようになるということで、これかなり大きい動きですね。
一方でニジボイスという音声合成サービスがあったんだけど、ここに学習に使っている声が著作物に違反してるんじゃないかということで、いろいろクレームが入りまして、サービス自体が廃止、中止ということになりましたね。
一方でイレブンラボという音声合成のサービスの方は、日本の声優さんと契約することによってこれから拡大していくよって話があって、かなりこの両極端な二者だったなと思ってます。そして、ワーナーミュージックはですね、スーノと提携しましてですね、これによってさっきのスーノの学習モデルが変わるって話になるんですけど、この辺も大きかった話かなと思います。
さらにはエイヤーブラウザーもどんどん出ましたね。まず中国初の、世界初と言われているフェローというブラウザーに始まって、アークからはディアですね、パープルシーからはコメット、チャットGPTはアトラスですね、ブレイブからレオですね、オペラからはネオン、そしてクロードインクロームということでですね、拡張機能がいろいろ出てきました。
次はいよいよね、大本命はGoogle、クロームのエイヤーブラウザーじゃないかなと思います。これ海外では始まってますけど、日本まだ来てませんけど、この辺が来ます。さらにはですね、連携モノでいわゆるMCPと言われているものが、2024年の11月からですね、アンソルピックが提案したものをですね、各社が今追随してますよね。さらにはエージェントスキルっていう考え方も、アンソルピックが2025年10月から提案して、これを各社が追随する流れになってきています。
そして、チャットGPTもApps in Chat GPTということで、アプリ連携をチャットGPTでできるような仕組みになってきましたね。さらには、バイブコーディングですね。これ今年の4月に生まれた言葉で、10月にはGoogle ASRに導入されましたが、このカーソルとかDevin、クロードコード、コーデックス、GitHub、コパイロット、キロ、ジュールズ、レプリットみたいな形でバイブコーディングもたくさん出てきた1年じゃないかと思いますね。
ということで、今年1年振り返ってみると、結構いろんなニュースがあったんじゃないかと思いますが、また来年も頑張っていきたいと思いますので、引き続きですね、よろしくお願いいたします。ネットビジネスアナリスト、横田秀珠でした。ありがとうございました。バイバイ。
13:42

コメント

スクロール