1. ペスハムの「価値ある人が報われる」ラジオ
  2. GPTにできなくてGeminiにでき..
2025-09-14 10:19

GPTにできなくてGeminiにできること

地方でAI活用に興味がある方はこちら!(ブログ)
https://chihoai.com/
補助金を活用したAI研修に興味ある方はぜひLINE登録を!
https://lin.ee/u1NIkhv
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5f7e673ff04555115dc868ae

サマリー

このエピソードでは、GeminiがGPTにはない機能について解説しています。特に、マルチモーダル対応やGoogle Docsとの連携、またGoogle AI Studioの活用方法に焦点を当てています。

Geminiの優位性
はい、今日はですね、GPTにできなくてGeminiにできること、というお話をしていきたいと思います。
今日朝起きて上がってきたニュースで、App Storeのダウンロード数で、GeminiがChat GPTを抜き去って1位に踊り出た、というニュースが飛び込んできました。
それだけですね、GPTをGeminiが上回りつつあるというか、2022年にChat GPT 4が出た時にですね、一斉を風靡して一気にですね、生成AIの時代だという風に、
この時代を作ったChat GPTが今、GoogleのGeminiに抜かされてきているというところがあるそうです。
改めて今の段階で、GeminiができてGPTにはできないこと、これを振り返っていきたいという風に思います。
ちょっとね、僕も全てのAI知識を入れているわけではないので、抜け漏れとか足りていないことも多分あるかと思いますが、ご容赦ください。
はい、ということで、一つ目はですね、マルチモーダル対応というやつですね。
このマルチモーダルというのは一言で言うと、さまざまなコンテンツ、さまざまな形態に応じてこの生成結果を応用することができる、こういうことを言うと思います。
GoogleのGeminiに関しては、例えば動画生成はGoogle VO3ですね、VO3だとか、あとは音声生成に関してはスピーチジェネレーションですね。
これは主にGoogle AI StudioというGeminiとは似て非なるですね、モデルで使うことができたりします。
他にも音楽生成がリリアというものがあったりだとか、とにかくですね、ありとあらゆるジャンルの生成が可能というところですね。
これはある意味、そうですね、Googleに契約をしていて、GPTに契約をしていない場合、これで例えばGoogleのGeminiで生成した結果をですね、動画に入れたり音声に入れたりみたいなことが可能になる。
一方でChat GPTのみに契約している場合はこれできないですよね。これは一つGoogleの大きなメリットかなというふうに思います。
ドキュメントとスクリプトの活用
そして2つ目がGoogleの様々なドキュメント、スプレッドシート、スライドといった、こういったツールにおけるGeminiの活用ですね。
これはGeminiの有料プランに入っていると、ドキュメント、ワードみたいなやつですね、とかスプレッドシートとかGoogleスライドについては、右側にですね、サイドパネルというのがついていて、それをですね、使うことができるというところなんですよね。
ただ僕個人的にはですね、あんまりこのサイドパネルでの活用はちょっとイマイチだなというふうに思っていて、Copilotのほうがサイドパネルに関しては結構強いんですよね。
ちょっとそこが微妙だなというふうにも感じてはいるんですけど、ただ強いのがGoogle Apps Scriptという、いわゆるですね、この専用のコードを書いてそれに従った動きをすることができるというところがあります。
それぞれ右上のほうにですね、拡張機能というタブボタンみたいなのがあるので、そこからですね、Google Apps Script、通称GASって言われているやつですね。
GASの頭文字を取って、ここにですね、アクセスをして、最初ファンクション何たらみたいな感じでコードが書いてあるんですよね。
これを、僕は結構ChatGPTに作ってもらっているんですけど、Geminiでも全然OKですよね。
このGeminiでこれこれこういうことをしたいので、そのGASのコードを書いてみたいなふうに言うと書いてくれるんですね。
そのコード自体の意味がわからなくても、それをですね、コピペして貼り付ける。
それでやってみるということ。
それで1回目でうまくいくっていうことはもしかしたら少ないかもしれないんですけど、簡単なコードであれば一発でうまくいくかなというふうに思います。
設定するときになぜかですね、権限を確認みたいなことをしなきゃいけなくて、場合によってはですね、ちょっとめんどくさい警告みたいなのが出て、これは安全ではありませんみたいな。
そこに対してもOKですっていうふうに言わなきゃいけないんですけど、それを言うと作動してくれるということですね。
これをやることで、特にMicrosoft OfficeのWordとかExcelじゃなくて、Googleのドキュメントとかスプリットシート、スライド、こちらを使っている方々はですね、
この作業自体の時短といいますか、自分が作りたいものに合わせて自動化することができるというところがあります。
具体的に言うと、やっぱりスプリットシートでさまざまなデータをまとめているときに、このデータの整合性をとるだとか、あるいは細かい間違いというか、ちょっとデータがムラがあるとか、
ここは西暦で書かれているんだけど、ここは平成とか令和とかで年号が書かれているみたいなときに、そういったものをですね、きれいにするだとか。
それのデータをグラフに一気に書き起こすだとか、そういったこととかを結構やってくれるのでおすすめだったり、あるいはスライドの自動生成みたいなこともできますよね。
僕はマジンさんという方が作っているマジン式プロンプトというのをですね、ちょっと使ってもらっているんですけど、それを使うとですね、かなり高精度なスライドをですね、
一発で作ることができるみたいなところがあるので、こういったところを使っています。
Google AI Studioの機能
3つ目ですね。3つ目にGoogle独自でできること、Gemini独自でできることというところでいきますと、やっぱりですね、Google AI Studioの存在かなというふうに思います。
これはですね、Geminiに課金しているとか関係なしに使えるんですけれども、一つナノバナナですね、最近有名になったこの画像の一部をですね、変更したりだとか、その画像の特性を保ったまま別の画像にするみたいなところがですね、可能になる。
それがGoogle AI Studioの上でできるよということで結構話題になったかと思うんですけど、このGoogle AI Studioというのがもう本当にすごくて、これもともとですね、この試験運用版みたいな形で、Googleが使った、このGoogle AI Studioで表現されたデータをですね、Google Geminiの改善に使っていくっていう、そういう位置づけで作られたサイトみたいなんですね。
なので、無料で使われる代わりにデータ内容は学習されてしまうよという、そういった前提があります。それも同意の上でですね、使うとなると、すごくGeminiでは使えないような内容とかもたくさんできる。
そのナノバナナに関してもいち早く使えました。今はGeminiでも使えるのかななんですけど、いち早く使えるようになりましたし、他にも音声をですね、音声データMP3データとかM4Aデータとかね、こういったデータを読み込ませることもできるということですね。
つまり、例えば議事録のところで、自分がZoomとかの主催者であれば直接文字起こしとか取れるんですけど、自分が主催者でないときにその打ち合わせの内容を録音しておいて、それをですね、Google AI Studioに放り込むと、それで議事録が完成するであるとか。
他にも様々なですね、このGeminiにはできないけど、Google AI Studioではできるみたいなところが用意されているわけです。さっきのスピーチジェネレーションの音声生成とかもまさにそうですね。結構音声データはね、やっぱりね、GeminiでもChat GPTでも扱えないことが多いんですよね。
こういったところがですね、幅広く使えるっていうのがGoogle AI Studioというところですね。ということで、今回本当に改めてChat GPTとGeminiを比較して、Geminiにしかできないことっていうのがすごくたくさんあるなというふうに思って、これからのね、何て言うんですか、AIの活用勢力っていうのがね、どういうふうになっていくかというのが結構楽しみですね。
これからそれを踏まえてChat GPTはですね、オープンAIは何か仕掛けてくるのかというところ、この辺もとても楽しみなところです。ということで、今日もですね、あなたの地域が何か一つでも変化がありますように、いってらっしゃい。
10:19

コメント

スクロール