1. iPad Workers
  2. #169:ChatGPTとは違うGEMINI ..
2025-07-12 20:29

#169:ChatGPTとは違うGEMINI CLIの強み

spotify apple_podcasts

👋 こんにちは、はるなです。

今日のテーマは「GEMINI CLIを使ってみた」です。一言でいって、私の執筆環境との相性が良すぎました。

おすすめの記事

本日📅よりiPadセミナー開催! →🎥予定もメモもプリントも!iPadで情報まるごと整理セミナー

🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。リクエスト・感想などは #iPadWorkersのハッシュタグを付けて投稿してください。

🧠 なぜGEMINI CLIを使い始めたのか?

GEMINI CLIは、Googleが提供するAIアシスタントをコマンドラインで操作できるツールです。ローカル環境のファイルやフォルダを直接読み込ませながら、ChatGPTのような自然なやりとりで様々な作業を支援してくれます。

CLIとは Command Line Interface(コマンドライン・インターフェース) の略で、キーボードでコマンド(命令)を入力してコンピュータを操作する方法です。

いわゆる「黒い画面」と呼ばれているターミナル上で、GEMINIを使って自然言語による対話ができるというものです。コード生成やバグ修正はもちろん、タスク管理、コンテンツ作成など多岐にわたる作業をサポートしてくれます。

GEMINI CLIの主な特徴とメリット

* 無料で利用可能:個人のGoogleアカウントと無償のGemini Code Assistライセンスを取得するだけで、毎分60回、1日あたり1,000回のリクエストが無料で利用できる

* 高いコンテキスト理解能力:最大100万トークンのコンテキストウィンドウを持ち、文字数が多くても比較的安定して作業を進めることができる

* プロンプトの再利用が可能:直接指示を書くこともできるが、プロンプト(指示)をテキストファイルにまとめておき、そのファイルを読み込ませることが可能

* ローカルファイルの操作が簡単:ターミナル上で「このファイルの中身を読んで」「この内容をこのファイル名で保存して」といった指示が自然言語でできる

GEMINI CLIの詳しい使い方などはこちらの記事などがわかりやすいと思います。→Gemini CLI の簡単チュートリアル

とにかく、手元にあるローカルのファイルを簡単に読み込んで、編集などをしてくれるので、私の今の環境と非常に相性がいいのです。

ただこれ、iPadではGEMINI CLIをそのまま使うことは基本的にできません。ごめんね。私はVS Codeというアプリで使っています。

🖥️ GEMINI CLIでまとめ記事作成してみた

iPad Workersでは毎月、1ヶ月間に配信したニュースレターをまとめて紹介したものを送っています。

今までは手作業で過去記事を一覧にし、記事の説明コメントを入れていましたが、7月2日に送ったものはGEMINI CLIを使って作成したものです。

🏄‍♂️ iPadとAIで「考える」がもっと自由になる

過去に書いたニュースレター原稿は、Obsidianで執筆しているため全てローカルに保存されています。

6月に書いた記事まとめのニュースレター作成したい

って言ったら、勝手に考えて探してくれました。こんな感じのファイル名かなとあたりをつけて検索してくれて、見つからなかったからファイル名か保存フォルダを教えてくれと。

@iPad\ Workers/o-\ 250628_🧼考えたくなる状況のデザイン教育の設計.mdこんな感じのやつ

サンプルとして1つファイルを指定してあげると、その命名規則をもとに6月の原稿らしきものを自動で集めて解析がスタートします。

そして新規作成されたマークダウンファイルがこちら。普段私が原稿ファイルに入れている項目や形式をうまく真似ています。

ChatGPTでもできなくはないんですが、ファイルを読み取ってもらうために、ファイルアップロードなどが必要です。その点、GEMINI CLIを使えば、ローカルにあるファイルを簡単に読み込んでくれます。

黒い画面、ターミナル、コマンド入力と聞くと、躊躇してしまう人も多いかもしれませんが、その辺りもChatGPTを使うとめちゃくちゃ簡単です。

私自身、ターミナル使えないし、コマンドも知らない状態からでしたが、ChatGPTに「どうやって使うの?」と聞けば、インストール方法や使い方まで丁寧に教えてくれました。

また、エラーが出た時はそのままエラー画面をスクショしてChatGPTに貼り付けるとエラーの原因や解決方法まで教えてくれます。便利になったなほんと。

とにかくGEMINI CLIを使うことで、これまで数時間かかっていた作業が、5分程度で完了するようになりました。

🔍 ChatGPTと違うGEMINI CLIの強み

ChatGPTも、もちろん優秀です。ただ、ファイルが増えると精度や処理スピードにばらつきが出たり、微妙なニュアンスがずれてしまうことが悩みの1つでした。

その点、GEMINI CLIは「ローカル環境でのファイル操作」と「スタイルの再現性」に強みがあります。

ファイルを手元のフォルダから指定して読ませられるし、結果も自動で新規ファイルに保存されます。いちいちWebブラウザやアプリからコピーしてペーストしなくていいので、かなり楽です。

ファイル形式変換もできます。

ファイルのリネーム作業も簡単です。この手の作業って、コマンドラインを日常的に使っている人ならそんなに難しくないのですが、普段この手のツールを使わないような私みたいな人だと、どんなコマンドを入力すればいいのかがわからないので、なかなか思うように作業が進みません。

その点、GEMINI CLIを使うと、自然言語でやりたいことを伝えるだけで、GEMINIが考えて代わりにコマンド作業を進めてくれます。

ローカルの複数ファイルを横断的に読み込んで、作業するならGEMINI CLIのようなツールがぴったりなのだと感じました。

ターミナル操作が不安な人でも、きっと大丈夫です。ChatGPTに聞けば全部教えてくれるし、数回使えば慣れます。むしろ一度慣れると、手放せなくなるツールになるかもです。

ということで今日は「GEMINI CLIを使ってまとめ記事を執筆してみた」というお話でした。

本日📅よりiPadセミナー開催!

iPadOSやApple標準のアプリを使った、手軽で便利なiPad情報管理術を紹介します。

* 前半パート|時間とタスクの“見える化”術

* 後半パート|プリント・メモ・情報の整理整頓術

🎥予定もメモもプリントも!iPadで情報まるごと整理セミナー



This is a public episode. If you'd like to discuss this with other subscribers or get access to bonus episodes, visit ipadworkers.substack.com/subscribe

サマリー

GEMINI CLIは、GoogleのAIをコマンドラインインターフェースで操作できる新しいツールです。このツールは、ファイル操作や分析を簡潔に行える便利さがあり、特にiPadユーザーにとって魅力的です。また、設定が簡単で視覚的に魅力的なインターフェースを持ち、AIとの連携が可能です。エピソードでは、GEMINI CLIの利用方法と利点が語られています。

GEMINI CLIの紹介
スピーカー 1
iPadのことばっかり話す、iPad Onlyのポテキャスト、iPad Workersポテキャスト、今日はGEMINI CLIの話をします。
スピーカー 2
iPadで使えんやつやん!
スピーカー 1
そうなんですよ。でも最近、GoogleのAI、GEMINIをコマンドラインインターフェースで動かせるよっていう。
スピーカー 2
黒いやつだよね、一般的に言われる。
スピーカー 1
一般的に黒い画面って言われる、ターミナルとかで動かせる。
そこでGEMINIが使えるようになるっていうのがあって。
割とその導入がすごく簡単なのと、あとは今、現在で言うと、一応その1日のリクエスト上限とか月のリクエスト上限はあるんだけど、すごい緩くて。
スピーカー 2
普通の人が普通に使っておったら無制限に近い感覚ってイメージなのかな?
スピーカー 1
感覚はそうかな。Googleのアカウントでログインする方法と、GEMINI APIを発行して、そのAPIを使って動かすのと、2種類あるんだけど、Googleアカウントでログインしちゃったらめっちゃ簡単だし。
スピーカー 2
APIだとアカウントと紐づけずに使えるってことですね。
スピーカー 1
いや、APIを発行するときにどっちみちアカウントでログインはしないといけないから。
APIの方だと、どれくらいのリクエストかによって、1点までは無料だけど、そこから先は課金が必要になるとかいうのがあるかな。
でも試す分にはどっちにしても、基本今現在は無料で全然使えるよっていう話で、全然iPadで使う。
スピーカー 2
Pythonista使ったら使えるんかな?
スピーカー 1
Pythonistaでクラウドで処理してしまえば、Pythonに入れてクラウドで処理させることができれば多分動かせるけど。
それはあれだよね、コマンドラインの意味があんまりないというか、価値があんまりないんだよね。
今自分はどうやってるかというと、パソコンMacのVS Codeっていう、これもフリーのアプリだけど、そのアプリのターミナルの画面に出して使ってる。
スピーカー 2
一般的にChat GPTと何が違うんって聞かれるんじゃないかと思うんやけど。
スピーカー 1
色んなところが違うのはそうなんだけど、まず自分の使い方で言うと、自分の書いたファイル、過去に書いた原稿とかを渡して、それについて構成してくださいだったりとか、
それをベースに、そのフォーマットに乗っ取って、次の新しいものを書いてくださいだったりとか、
そういう指示をよくChat GPTでもやるんだけど、それをするときにファイルを指定するために、Chat GPTの場合はファイル添付とかも使えるんだけど、
なんかね、自分のやり方が悪いのかわかんないんだけど、Chat GPTにファイルを添付していくと、あんまり精度が高くないっていう。
スピーカー 2
あと遅いよね、凄い処理が。
スピーカー 1
処理に時間がかかるっていうのと、あんまりなんかちゃんと読んでくれない時がある。
スピーカー 2
本当に読まんねえやろうなって気がする。
スピーカー 1
っていうのがあって、普段どうしてるかっていうと、プロンプトを書くチャット欄に、そのまま直張りで記事の内容を全部コピーしてペタって貼って、
そのフォーマットを分析させたりとか、これにのっとってこうしてくれとか、これを構成してくれみたいな感じでやってるから、
Chat GPTでやるときはもう設定を全部プロジェクトに入れちゃって、そこで処理をしてるとか、
Chat GPTも作ったやつがあるから、それで処理をするっていう感じが多かったんだけど、
今回、GoogleのGemini CLIを入れて、そこのコマンドで操作をするときに、
スピーカー 2
VS Codeの画面だと普通に普段使ってるObsidianのファイル、フォルダを左側のメニューのところに表示させて、
スピーカー 1
真ん中にGoogle CLIが出せて、カーソルみたいになるって感じなんだよね。
カーソルでファイルを指定して、そのファイルにコマンドラインなので、直接そのファイルを操作すること、
ファイル名変えたりとか、ファイルを上書きしたりとか、ファイルの保存場所を動かしたりとかも全部できるわけ。
なので、それを使って、ちょうどこのiPad Workersのニュースレターで、
まとめ記事っていうのを毎月、1ヶ月分の発行したニュースレターをまとめる記事っていうのを月頭とかに送ってるんだけど、
それをGemini CLIで作らせたら、めっちゃよくできた。
スピーカー 2
それはGeminiが優秀ってことでもあるのかな?
スピーカー 1
前回、先月だったかな。先月のまとめ作るときは、カーソルのマルチエージェントを使って同じようにやったのね。
やってることは一緒で、ファイルを渡して。
GEMINI CLIの利点
スピーカー 2
感覚的には同じことをやっている。
スピーカー 1
で、このフォーマットに合わせて、全部の記事のまとめを作ってくれ、みたいな。
全部を紹介する記事を作ってくれって言ったら、なんかね、いまいちだったの。
で、そこで今回使って、Gemini CLI使ったら、
まず、先月のまとめ記事を読ませて、この記事のフォーマットを分析しろって。
そしたら、これはこういう感じのやつで、こういうフォーマットでこういうことが書かれていて、みたいなのを分析した結果をまず出してくれます。
じゃあ今度は、ファイル名に日付を入れているので、
2025年の5月2505から始まるファイル名のやつを、この階層の中から探してきてって言ったら、11個のファイルが見つかりました。
じゃあその11個のファイルを紹介する記事を、さっき分析したフォーマットに当てはめて作ってって言ったら、ちょっと時間かかるよ。
1分以上、100何秒待たされたから。
結構処理に時間はかかるんだけど、新規ファイルを作ってくれて、ファイルの保存もしてくれて、そこにちゃんといい感じでまとめられたものが出来上がった。
スピーカー 2
ほとんど手直ししてない?
スピーカー 1
ほとんどしてない。文章をちょこっと言い回しとか、こんな言い方あんま自分せんなみたいなやつは消して書き直したりはしたけど、ほとんど変えてないし、
すごいなって思ったのが、画像とか過去記事へのリンクとかも全部自動で前に送った先月のまとめのやつを見て、
あ、こいつはこの元原稿のここをこうやって入れて紹介してるんだみたいなのまで、ちゃんと分かってくれた。
スピーカー 2
フロントマターにURLが書いてあるとかそういう感じ?
スピーカー 1
フロントマター使ってないから、平で、
スピーカー 2
あー、リンクとかがペロって貼ってあって、こいつだろうなって予想してくれた。
コンピューターに分かりやすくしてあげる必要すらなかった。
スピーカー 1
まあまあ、普通に書くっていうかマークダウン形式でリンク形式で貼ってるから、読み取れるとは思うけど、
でもそんなフロントマターでURLはこれですみたいな指定をしてるわけでもなく、単純に自分が使いやすいように書いてるだけで。
スピーカー 2
人間なら多分分かってくれそうなってやつだよね。
スピーカー 1
そうそう、それが何も言ってないけど、先月書いたまとめ記事の原稿、マークダウンファイルとそれ分析させます。
スピーカー 2
5月のやつ探してきてって言ったら11個探してきて、それを当てはめてって言ったらできる。
やっぱさ、ジェミニーが優秀なんじゃないかって感じやんな、その話を聞くと。
スピーカー 1
十分、ジェミニーがこの間、新しいバージョン出てすごい話題になってて、優秀になったって言われてたから、
試したいなと思ってたので、ついでにって感じなんだけど、
ジェミニーCLIが正しい名前だと思う。
それも試してみるかと思って試してみたら、案外できた。
スピーカー 2
ついに今時の生成AIの最先端がコマンドラインツールだったっていうさ、
この2020年ぐらいにChatGPTが出てきた頃にそんな未来を想像していた人はいたんだろうかっていう面白さだよね。
スピーカー 1
そこはね、今後もうちょっと変わってくるかもしれないけど、
でも基本的に自分のローカルのデータを読み込んでくれる?
スピーカー 2
処理してもらえるっていうと、まずパーミッションの点でターミナルがやっぱり有利だよね。
スピーカー 1
で、そこがカーソルは画期的だよって言われてたんだけど、
カーソルってマルチエージェントを使うためには月額3000円ぐらいだった。
事実上無料では使えないレベルだった。
っていうのが、今現在ジェミニーCLIの使用料がかからないからっていうのはあるんだけど、
現状カーソルでやろうとしてたことが今できてる。むしろいい感じにできてるみたいな。
スピーカー 2
唯一の難点はカーソルより初期設定は難しい。
多くの人はインストールすればええやんっていうのと、
VS Codeを入れた後ジェミニーCLIをインストールしましょうはだいぶ違うと思うんやけどな。
スピーカー 1
違う違う。それもChatGPTに聞けばめっちゃステップバイステップで教えてくれて、
まず最初に、自分の場合はVS Codeを最初から使いたかったので、
VS CodeにジェミニーCLIをインストールする方法って言って、
ChatGPTに投げかけたら、このコマンド使うかこのコマンド使うかでできるよみたいな感じで、
VS Code内でターミナル画面を開く方法から順番に出してくれて、
それができたらコードでこれを入れてくださいってコピーすぐにできる状態で出してくれるかコピーしてペッて貼ったらできるし、
もし失敗っていうかエラーが出たらエラーをそのままChatGPTのとこに貼ると、
そのエラーを分析して、これはこういうエラーなのでこうしてくださいみたいなのを教えてくれるから、
何にも困らなかった。
スピーカー 2
ポッドキャスト聞いてくれてるような人はその話で多分できると思うけど、
でもかなり多くの人はそう言われてもやらんし分からんやと思うけどな。
スピーカー 1
本当にこれはローカルのファイル操作が得意というか、
通常、
スピーカー 2
ターミナルイメージとしては、ターミナルと生成アイが合体するんだよね。
スピーカー 1
もともとVSコードにもそういう機能はあるし、
カーソルとかももともとはエンジニアさんがソースコードを修正したりするときに
Gemini CLIの特長
スピーカー 1
そのAIと相談しながら書けるとか、
そういうので注目されてたやつなんだけど、
でも使いようによってはライターというか文章を書く人にもすごく使えるし、
タスク管理とかにも結構使えるよっていうので
カーソルがすごい話題になったよね。
あれと同じような感じで、
このGemini CLIというのも導入こそちょっとコストが高いというか、
カーソルよりは少なくとも大変だと思う。
スピーカー 2
個人的に自分の場合ね、
スピーカー 1
カーソル入れるよりも簡単だ。
カーソル入れて初期設定みたいな。
スピーカー 2
VSコードの設定画面は分かりにくすぎて死ぬ。
カーソルもそれを引き継いでいるので、
もっと分かりにくくて死ぬ。
スピーカー 1
カーソルの設定画面で、
前やったときにたまたまVSコードからの設定を読み込むかみたいなので、
スピーカー 2
読み込んでしまってわけわからなくなった。
スピーカー 1
わけわからなくなってうまく動かなかった。
自分の意図したように動いてくれなくなってしまったりしたので、
そういうのもあったんだけど、
このGemini CLIの場合は、
スピーカー 2
逆にSaraから始まるから。
スピーカー 1
インストール方法が2種類くらいあって、
NPMでNode.jsを入れてある端末でインストールすれば、
そっちだと画面がグラフィカルな感じで、
ようこそGeminiみたいな感じで、
すっげーカラフルなロゴが出て、
で、Yes、Noとかもボタンで矢印で動かすんだけど、
はいとかいいえとか、設定どうするか、
連携もGoogleアカウントで認証するのか、
APIキーで認証するのかとかも、
2個のポチポチがあって、それで選べる。
スピーカー 2
でもあれだよね、面白いのがさ、
映画で出てくるコンピューターできる人のイメージのあの画面で、
操作しているわけでしょ。
スピーカー 1
そうだね、黒い画面ってよく言われるやつね。
スピーカー 2
で、あれでYes、Noとかって入力していて、
それがやっぱ今の生成AIの最先端だぜ、
はやっぱクッソ楽しいし、
すごいできる人、
まずはるながNPMとかっていう言葉を使うとは思わんかったしね。
スピーカー 1
全然知識はないから、
ただ単純にChatJPTがその2種類があるよって教えてくれたから、
知ってるだけ。
スピーカー 2
NPMとピッグだっけ?
ピッグ。
スピーカー 1
なので、今ならできるって感じで、
そのターミナルっていうの。
スピーカー 2
前提のChatJPT的なものがなかったら絶対できんというか、
やる気になれんよね。
スピーカー 1
やったとしても、つまずいたらもうそこで終わるみたいな。
結局、前もどっかで話したんだけど、
エラーコードが出たときに、
エラーコードをさ、
スピーカー 2
全部貼ればいい。
スピーカー 1
検索とか普通にChatJPTとかないときは、
Googleとかに貼るんだけど、
なかなかその同じ事象に当たってる人とかがいないとか。
スピーカー 2
あれで賢くなる側面は確実にあるんだけど、
でもちょっとやっぱハードルが高すぎるよね。
スピーカー 1
その点、ChatJPTに投げると、
これが間違ってます。
ここを改善すれば治りますっていう、
先生役すっごい上手にしてくれるので、
全然知識がなかったとしても、
なんとなくは分かるっていうか、
覚えるじゃないけど、
肌感覚はついていくみたいな。
スピーカー 2
結局ね、たぶん原理原則を学ぶことと、
手を動かすことの両方が必要で、
やらんかったら絶対できるようにならんからね。
スピーカー 1
そう、だからやっぱ自分で手を動かしてやることが
一番大切だなっていうのはもともと変わらないし、
で、実際そのGemini CLIを導入っていうか、
やってた時間、たぶん30分とか1時間ぐらい。
朝の一番最初の時間に、
気が向いてからちょっとやってみるかってやってみたら、
そんな感じでいい感じにできたので、
またよかったらニュースレター、
そのGemini CLIで作ったニュースレターは、
導入と実際の使用感
スピーカー 1
7月2日に配信した5月のまとめ。
ちょっと1ヶ月前のやつ。
スピーカー 2
5月のまとめじゃないんだ。
スピーカー 1
じゃないの。1ヶ月開けてんのわざと。
はぁ。
先日出たやつとかってさ、
割と最近見たからあんまりまとめてもあれかなって。
スピーカー 2
あ、意図的に1ヶ月遅らせてるんだ。
スピーカー 1
そうそう、意図的に。
で、ちょっと間を空けて、
1ヶ月前のやつを1ヶ月分紹介するようにしてるので、
スピーカー 2
Gemini CLIでどんなもんができてるのかっていうのを見てもらえたらいいかな。
スピーカー 1
5月ってGemini CLIまだなかった?
ないよ。CLI、割と最近だよ。
スピーカー 2
20何日とか。
やっぱあれだよね。
クラウドのやつもまだなかったっけ、その頃って。
スピーカー 1
クラウドのやつは5月末やったから6月ぐらいやから、
その頃かもしれない。
スピーカー 2
少なくとも2025年が始まった頃にはまだなかったんだよね。
スピーカー 1
そのなかったっていうのが、
アーリンアクセスとかエンジニアの有料プランのさ、
高い方の人たちには先に開放されてたりするから、
そっちはもう始まってたかもしれないけど、
一般ユーザーっていうのを広く全員が使えるようになった。
Google AI Studioとかも全開放、
全開放とは言わんけど開放されたのがついこの間って感じで。
スピーカー 2
ただの思い出話なんだけど、
ChatGPTが出始めたばっかりの頃さ、
めっちゃすげーって感動した記憶はあるんだけど、
もうその頃と別世界なぐらいあらゆるものが変わりまくってしまったよね。
スピーカー 1
ネット界隈ってその辺の進めめちゃくちゃ早いし、
さらにAI界隈なんてもっと早い。
スピーカー 2
半年前だともう分からん、別世界になっているって半年前から見て。
スピーカー 1
そうなってくるので、新しい情報をどこまで拾うかとか、
どう使っていくかっていうのがすごい難しいところではあるけど、
でも使わなければ何も分かんないから、
ちょっとは触っておくことがおすすめかなと。
スピーカー 2
どういう業界でどう生きていくにしても、
たぶん確実にあらゆる業界に入ってくるしね、この手のやつは。
スピーカー 1
やっぱこの手のやつ、使えば使うほど使えるようになる。
スピーカー 2
肌感が身につくみたいなやつ。
スピーカー 1
身についてくる、感どころがついてくるから、
もしそれがバージョンが変わったとして、
ツールが変わったとしても、
結構その感どころは共通して使える部分があるので、
その話を聞いて分かったっていうのは、
分かったつもりになる部分が大きいから、
1回5分でもいいから、試してみてほしいなと思う。
このGemini CLI、iPadでは実際使えないので、
スピーカー 2
別にiPadの話をする、
ハルナのテーマがiPadのことばかりじゃなくて、
いいんじゃないかと思うからね。
スピーカー 1
こうやってコンテンツ作っている人には、
結構便利なんじゃないかなと思います。
ということで今日は、
Gemini CLIを使ってみたよっていうお話でした。
番組への感想やリクエストなどは、
シャープ、iPadワーカーズのハッシュタグをつけて投稿してください。
それではまた来週、iPadワーカーズポジションでした。
iPad、iPad
20:29

コメント

スクロール