1. iPad Workers
  2. #170:GEMINI CLIが私の苦手な..
2025-07-18 26:48

#170:GEMINI CLIが私の苦手な作業を全部やってくれた

spotify apple_podcasts

👋 こんにちは、はるなです。

今日のテーマは「GEMINI CLIで“書く作業”がここまで変わった」です。

先週はGEMINI CLIを導入したという話でしたが、今回はそのGEMINI CLIを使ってどんなことをやっているかというお話です。

前回のエピソード→ 🌈 ChatGPTとは違うGEMINI CLIの強み

おすすめの記事

* 📖 ノートを開くと、やる気が動き出す

* ✍️ 書くことで考える:デジタルならではの囲む技術とは?

🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。リクエストや感想は、#iPadWorkersのハッシュタグを付けて投稿してください。

😅 苦手な作業が、苦手じゃなくなった

年に何冊かリリースしている電子書籍ですが、電子書籍制作の中でいちばん苦手な作業は何ですか?と聞かれたら、一番は「画像まわりの整理作業」です。

Markdownで原稿をePubに変換する作業には、画像のリンク切れ確認や画像ファイル集め、CSSの調整など、地味に時間がかかる部分がいくつもあります。

これがずっと苦手な作業でした。

でも今は、「自分でやらなくてもいいかも」と思えるようになりました。その理由が、GEMINI CLIです。

前回、ニュースレターの1ヶ月分のまとめを自動で作る作業を試してみて、これなら電子書籍制作の作業にも使えると思い立ち導入してみました。

その結果、劇的に楽になったのです。

📚 原稿構成チェック、CSS調整まで

具体的にどうやって電子書籍を作成しているのかは、過去記事でプロセス紹介をしています。

* 🔍 iPadアプリ図鑑の裏側

* 📚Obsidianで始めるデジタル出版

すごくざっくり説明すると、pandocでMarkdownをePubに変換し、CSSで見た目を調整して作成しています。

今までなら次のようなコマンドで指定していたものが、GEMINI CLIを使うと、すべて自然言語で指示できます。

pandoc -f markdown -t epub3 *.md -o book.epub --css default.css --epub-cover-image=cover.jpg --toc --toc-depth=2

つまり、「このフォルダのMarkdownをまとめてePubにして」でOKになったんです。

他にも「原稿文章内の半角英数を全角に変換して」とか、「画像ファイルを集めてきて」「全体を通して読んでみて違和感あるとこ教えて」と頼めば、必要な処理を次々とこなしてくれます。

まるで「とても優秀な部下」と作業しているかのようです。

今回作っている『書いて考える技術』という本では、これまで使っていた横書き用のCSSを縦書きのレイアウトに修正する必要がありました。そういった調整も全てGEMINI CLIでできました。

もちろん最終判断は自分ですが、細々した作業はすべて自動で行えたので、苦手だった作業が苦手じゃなくなりました。

Obsidianで書いたMarkdownファイルをそのまま読んで処理してくれるので、余計な変換やアップロードも不要です。

🧩 GEMINI CLIはObsidianとも相性がいい

GEMINI CLIは私にとって、できるアシスタントであり、優秀な編集者でもあります。

「本にする」ための整形作業やファイル整理に、今まで苦手意識がありましたが、GEMINI CLIを使うことで、その苦手意識はほとんどなくなったと感じています。

もちろん、現時点ではiPadでは動かせません。けれど、iPadで書いた原稿を、Macで調整、iPadでチェック、というワークフローが自然に成り立つなら、iPadユーザーにとっても大きな可能性のあるツールだと思います。

そういった意味でもローカルでファイル管理ができるObsidianユーザーにはすごくおすすめのツールです。

ということで今日は「GEMINI CLI導入で電子書籍制作作業がここまで変わった」というお話でした。

4月にリリースした📘 iPadアプリ図鑑2025の時は、まだGEMINI CLIがなかったので、3ヶ月とかでここまで作業フローが変わるんだと驚きも大きいです。



This is a public episode. If you'd like to discuss this with other subscribers or get access to bonus episodes, visit ipadworkers.substack.com/subscribe

サマリー

エピソードでは、GEMINI CLIを活用して、書くことや考える技術に関するプロジェクトの効率化について話し合っています。特に、Obsidianを使ったMarkdownファイルの管理や電子書籍の作成における手間を減らす方法が紹介されています。このエピソードでは、GEMINI CLIが特に難しい作業を効率的に処理する様子と、その機能の利便性が示されています。また、Cursorとの比較を通じて、GEMINI CLIの優れたパフォーマンスとユーザーインターフェースについても解説されています。加えて、GEMINI CLIを使用して作業を効率化する方法についても語られており、EPUBファイルやCSSの編集における便利さと効果的な活用法が紹介されています。

GEMINI CLIの紹介
スピーカー 2
iPadの言葉と、iPad Onlyなポットキャット、iPad Workersポットキャット、今日はGEMINI CLIの話パート2をします。
スピーカー 1
ハマっていますね、だいぶ。
スピーカー 2
そう、今やってる作業とすごく相性が良くて。
スピーカー 1
あ、そうか、コマンドライン的な何かと相性が良いことがあれば、それはめちゃめちゃ相性が良い。
スピーカー 2
前回はGEMINI CLIを使ってみたくてというので、導入が目的って感じで、何ができるかなっていうので、
1ヶ月間のiPad Workersで配信したニュースレターをまとめる記事みたいなのを自動で作るみたいなのをやってみたのね。
スピーカー 1
まあそれだけでも単純に結構だいぶ優秀だよね。
スピーカー 2
それで、すごい良いじゃん、すごい使いやすいじゃんって思って、
今ですね、取り組んでいるプロジェクトが、書いて考える技術っていうナレッジスタック、
ゴリゴさんのニュースレターやってる、ニュースレターのサブスタックでやってるナレッジスタックに、
月に1回原稿を寄稿するみたいな形でやってたのが10何回分溜まってて、
それを本にしようっていう形で今プロジェクトをやっているんだけど、
その原稿というのが全てマークダウンファイルで、オブシリアンで全部執筆しているので、
オブシリアンの中に全部入っているので、要はローカルで全部ファイルを持っている状態。
Gemini CLIを使って、本の原稿の元になるやつを1個のフォルダの中に分かりやすく、
これは別にしなくてもいいんだけど、
スピーカー 1
ブックとか原稿をフォルダに入れとくんだよね、分かりやすく。
スピーカー 2
そう、TTW、Thinking, Thought, Writing。
スピーカー 1
そんなんであるのは分かる?
スピーカー 2
分かんないけど、TTWって頭文字付けとけば、
オブシリアンとかファイル検索するときにやりやすいし、
実際、英語圏では書いて考える技術みたいな、書きながら考えるみたいなので、
ハッシュタグとかもあって、TTWっていう。
スピーカー 1
一般語なんだ、TTWっていうのは。
スピーカー 2
らしいよ、チャットGPTに。
スピーカー 1
アズリーワードっていうのかな。
スピーカー 2
実際にそうやって使われているのであれば、
その文字列使っておくのでいいかなと思って、
プロジェクトTTWが今ある。
スピーカー 1
プロジェクトTTWフォルダに原稿があって、
めっちゃ楽やん、パンドックをジェミニーにやってもらえばいいってことでしょ。
スピーカー 2
そう、しかもそれコマンドなんだけど。
スピーカー 1
コマンド覚えてないから、いつも履歴から取り出してくるんだけど。
スピーカー 2
そう、でもジェミニー賢いから、
パンドックしてって、自然言語でいいの?
スピーカー 1
このフォルダをパンドックでまとめてEPUBにして、で、いい。
スピーカー 2
パンドックしてって通じた。
スピーカー 1
語彙力いらんのや。
スピーカー 2
さらに言うと、今ずっと自分で作ってきてた電子書籍っていうのは、
パンドックっていうコマンドを使って、
マークダウンファイル、原稿をEPUBファイルにまとめる。
変換するみたいなことをやってるんだけど、
それがジェミニーCLIを使うとむちゃくちゃ簡単にできるし、
パンドックするためには、
普段書いているObsidianの中で書いている表記だと、
上手くその画像とかが出なかったりする。
スピーカー 1
Obsidianの表記だとダメで、
マークダウンの正規の書き方に変えんといかんってやつやね。
スピーカー 2
それをしないといけなかったりとか、
あとはファイルが参照できるように、
ファイルを相対パスにしないといけないとか、
スピーカー 1
いろんな細かな修正作業があったの、今まで。
画像を集めてきて、imgっていうフォルダ作って、
その中に画像を入れておいてっていう中で、
もともと画像リンクだったやつをimgの中の何とかjpegにして、
とかってやらなきゃいけなかったよね。
スピーカー 2
それがすごいめんどくさくて、
今まではObsidianのプラグインを使って、
一回マークダウンファイルをエクスポート、書き出すってすると、
一セットにマークダウンファイルと画像ファイルを改めて書き出して、
一個にまとめてくれるプラグインみたいなのを使って、
それで最終、画像とマークダウンファイル、
ちゃんとした指定になっているマークダウンファイルを準備して、
単独して本の形にしてたっていうのが、
今、Gemini CLIに、このマークダウンファイルの中に入っている画像を集めて、
このフォルダに動かしてって言ったら、
分かりました、じゃあファイルを見てみますねって言って、
ファイルの中をチェックして、
このファイルの中にはこの画像とこの画像とこの画像が入ってましたって言って、
ファイル名を3つ出てきて、
じゃあそのファイルがどこにあるか今からチェックしますって言って、
検索して、ファイルを検索して、
見つかったんで、これをこのファイルにムーブします、動かします。
動かしてもいいですか、コマンドを使ってやってもいいですかっていうのまでやってくれる。
スピーカー 1
あれじゃん、はるながずっと電子書籍を作るときに一番やりたくないって言ってくれたやつを全部やってくれとるやん。
スピーカー 2
そうなんですよ。
スピーカー 1
一番嫌だって言っとったよね。
スピーカー 2
一番嫌だって言って、
しかも私の原稿はゴリゴさんの原稿に比べて画像がものすごく多い。
その画像を何とかして集めてくるのがすごい大変みたいにずっと思ってたのが、
Gemini CLIに頼むと、
スピーカー 1
待っといたらいい。
スピーカー 2
そう、待っといたらいい。時間はかかる。
もちろんチェックしてくれてる時間分、やりとりの時間がかかるんで、
スピーカー 1
自分でプログラム書いたらもっと早いんだよね、実際に動作自体は。
スピーカー 2
ただファイルを探すのとかも、
例えば探してとかっていう適当な指示で、
ちゃんとそれを理解して、検索して、
検索したけどうまく見つかりませんでしたってなったら、
じゃあ検索方法をちょっと変えてみますわって言って、
自分で考えてやってくれる。
スピーカー 1
ここ以下にあるよとか教えてあげたりもしてないんだ。
オグシディアンボルトの中にはあるはずみたいなこと。
スピーカー 2
2,3回チャレンジして見つけられなかった場合は、
ちょっと私見つけられなかったんで、
よかったらそのファイル、画像ファイルが入っている場所を教えてもらえませんかって言ってくる。
スピーカー 1
だから基本はるなは待っといたらいいんや。
待っといてちょこっとお仕事をしてあげればいいんや。
スピーカー 2
だからその間に別の原稿の修正とかをしておいて、
その指定しているファイルは勝手に綺麗になって、
画像も動かされててみたい。
さらなる機能の利用
スピーカー 1
ああ、なんか本当部下に仕事を任せといて、
その間自分の仕事をしておいてできたんですけど。
スピーカー 2
指示は出してあげないといけないけど、
指示も要は今までだったら、
ターミナルで動かすためにちゃんとしたコマンドを入れないといけなかったし、
ファイルパスとかもちゃんと指定しないといけなかったんだけど、
Gemini CLIを使うことによって、そこがすっごい緩くなった。
スピーカー 1
人間ならさ、こう書いてあって、
これはこの画像を、このフォーマットのやつを変えたいからきっとこうなんだろうなっていう風に想像できるところを、
普通にできる人と同じぐらいの思考力でやってくれてるってことだよね。
スピーカー 2
過去のやりとりとかも覚えてくれてるから、
スピーカー 1
キャッシュもあるよね、あいつ。
スピーカー 2
辞めるまでは多分ずっとやりとりを覚えててくれるから、
一回それでできたら、次このファイル、このファイル、このファイル、
ファイル指定だけ。
フォルダの中全部って言ったら順番にやってくれそうな気がする。
順番にはやってくれるかな。
ただ、ところどころコマンドを動かす時とかに、
いいか、だめか。
一回だけ許可するか、全部許可するか、だめかみたいな。
スピーカー 1
ムーブとかデリートの時は特に言われるよね。
そうそう。
スピーカー 2
だからその辺で止まっちゃったりするから、
今は一ファイルずつやってるんだけど、
多分全然普通に一気にやることも時間はかかるけどできるし、
今日ちょうどやったのが、
一通り現行ファイルが一個のフォルダの中に入ったので、
そのファイルを通しで読んで、
なんかちょっとその流れがおかしいとことか、
こういうことを追加した方がいいとか、
そういう指摘があったら、まとめて別ファイルにまとめてほしい。
スピーカー 1
チャットで返すんじゃなくて、テキストMDファイルとして指摘をしてもらう。
スピーカー 2
そうそう。
ファイルを新規作成してほしいって言ってやったら、
めっちゃいい感じのやつを作ってくれて。
スピーカー 1
それは例えばオブシリアンで何かをする場合には、
チャットより便利なこと多そうだよね。
スピーカー 2
多いと思う。
例えば火をまたいだとしても、
そのファイルが残ってるから、
そのファイルを見ながら作業することもできるし、
スピーカー 1
自分でそこで直でメモ書いていけるもんね。
その指摘に対して。
スピーカー 2
そうそう。
チャット形式だとどうしても、
GEMINI CLIの便利さ
スピーカー 2
それをキャンバスに移動するとか、
コピペしてどこかに貼るとかしないといけないけど、
ファイルを別で作っておいてもらったら、
そこに直接編集できるとか書き込めるので、
すごく楽で。
それでやってもらったら、
1章に入れてた内容が、
このファイル、この文章だけ一室だから、
コラムにして独立させるか、
もしくは1章じゃない場所、
3章の実践のとこに持ってった方がいいですよ、
みたいなのとかも教えてくれて。
スピーカー 1
あれだよね。
人間が30分では読めないものを、
ジェミニさんは秒で読むんだよね。
スピーカー 2
秒で読んでるね。
ファイルチェックだけはテキストファイルだから。
スピーカー 1
それはもうだいぶ優秀やね。
スピーカー 2
そう。
多分なんだけど、
Cursorのマルチエージェント、
AIエージェントを使っても、
多分同じことができたはずなんだけど、
何か相性なのか、何なのかわかんないけど、
自分の場合はジェミニCLIがすごい良くて、
使ってるのが今ジェミニ2.5プロのエンジンというか、
そのエージェントを使っているので、
それもあってすごい賢い。
Cursorはね、
スピーカー 1
1回のリクエストで処理できる量が案外少なくって、
ちょっと同じことをやっていないからわかんないけど、
全部読んでがね、
トークン足りなくってね、
うまくいかないような気がする。
スピーカー 2
なんかその点多分ジェミニCLI、
ジェミニの読み取れるトークン数すごい多くて、
多分全然問題なく、
本1冊分ぐらいの文章量を全然読んでくれるし、
トークン数と料金モデル
スピーカー 2
チェックしてくれる。
スピーカー 1
Cursorはリクエスト回数で課金をするっていうモデルにしているからさ、
1回のリクエストを、
例えば30回分をひとまとめにしてやろうって思う人は当然いるからさ。
なるほどね。
スピーカー 2
トークン数で上限切っておかないと回数が稼げないのか。
そう。
スピーカー 1
ただ厄介なことにCursorみたいな中小の企業がGoogleと戦おうと思ってさ、
Googleはそれを今全部無料でやらせているわけでしょ。
スピーカー 2
これは多分最初だけって感じではあると思うけど、
今後はトークン数とかによって、
今でもAPI経由だとお金はかからない、
この回数までは無料でできますみたいな回数が決まってるんだけど、
その回数でのやり取りになるのが、
今Googleアカウントで認証して使うと、
そこが緩いみたいな規制が緩くて、
使い放題にほぼ近い感じ。
マークダウンファイルの利活用
スピーカー 1
10年先を考えるとさ、
おそらくはるなはCursorに課金することはないけれども、
Gemini CLIはこのままだと有料になっても課金するわけでしょ。
スピーカー 2
普段のニュースレターを書く程度なら、
別にChatGPTで全然よかったんだけど、
こういうちょっとボリュームのあるものとか、
複数のファイルを参照して、
何か作業をしてもらいたいみたいなことって、
ChatGPTでもできるかないんだけど、
スピーカー 1
やっぱ不便だよね。
スピーカー 2
ちょっと不便で、
その点、Gemini CLIと、
あとは自分がObsidianを元々使っていて、
全ての原稿が手元にある。
さらにそれがマークダウンファイルである、
という前提はあるんだけど、
そういう人にとってはめちゃくちゃ便利だぞ、みたいな。
ああいうターミナルを使ったコマンドのなんかって、
結局プログラマーさん向けに結構印象がついてて、
ちょっと前にカーソルだと、
一般の人のタスク管理とか、
ライターさんとか文章を書くような人のお手伝いも、
うまくやるとできそう、みたいな感じだったのを、
もう一段階便利にしてくれそう感。
スピーカー 1
やっぱUIが、カーソルはあくまでもベースはチャットで、
コマンドも入力できるんだけど、
Gemini CLIの場合、
コマンドがベースで返信もできるみたいな、
やっぱ主軸が違うから、
おそらく得意なのも、
よりコンピューターのコマンドラインに沿ったやり方だよね。
スピーカー 2
っていうのが思うね。
でも、例えばマークダウンファイルの文章の中に、
見出しだけ書いててさ、下本文空白の状態で、
ちょっとその見出しに合わせて、
本文何千文字分ぐらいでちょっと入れてみてとかって言ったら、
普通に書き込みしてくれる?
スピーカー 1
そうだね。その時に、
例えば同じフォルダの原稿を見て、
これに文体合わせろとか、口調合わせろって言えば、
前提とする文脈が自分のデータで表明できる。
スピーカー 2
やっぱそこが一番大きいかな。
チャットJPTとかでも、
もちろんカスタマイズすれば、
自分が普段考えていることとか、
自分が書いていることに寄せることはできるんだけど、
そのチョッキーの原稿とかさ、
読んでって言おうと思ったら、
ファイル添付しないといけないとか、
読み込ませないとプロジェクトにして、
アップロードしないといけないとかっていう、
手間がやっぱ1クッション入るんだけど、
Gemini CLIを使う場合は、
ローカルのファイルを読んでくれるわけだから、
勝手にやってくれる。
ここに入ってるよとか、このファイルだよって指定したら、
それがピンポイントで指定できるし、
多分指定しなくても、
この内容について書いてるやつを、
ちょっと探してみてってすれば、
カーソルでもそれはできてたけど、
ファイルを探してくれる。
検索よりもちょっと賢い検索みたいな。
スピーカー 1
コマンドラインの感覚みたいなものって必要だと思う。
黒い画面を上手に操作するというか、
あれで何ができるのかっていうイメージとか。
スピーカー 2
なくてもできるけど、
あったほうがいいには越したことはないかな。
スピーカー 1
難しいというか、
そういう概念を言葉で学ぶのってめちゃくちゃ難しくって、
ある程度自分でやってみないと、
パンドックでも意味がわからんくっても、
あの文字を打ってみたらこうなったとか、
でもそのためには実は、
現在いるディレクトリを該当の場所に変えてあげないといけなくって、
そういうことがあるわけじゃん。
スピーカー 2
それもGemini CLI、
TTWのプロジェクトをパンドックしてやってくれた。
スピーカー 1
じゃあ相当解釈してくれるわけ。
スピーカー 2
だいぶ解釈してくれる。
ディレクトリの移動とかもしなくてもよくって、
そういうのは多分知ってる人ならあれね、みたいなのがわかるんだけど、
黒い画面って言われる、要はターミナルとかっていうのの中では、
今いる場所が結構重要?
スピーカー 1
カレントディレクトリを元にして、
その相対で指定する。
スピーカー 2
CDってカレントディレクトリ?
スピーカー 1
チェンジディレクトリ。
スピーカー 2
チェンジディレクトリ。
何かわかんないけど、
CDって打って、
スピーカー 1
押すとそこに移動できて、
その後パンドックってしましょうってやつ。
スピーカー 2
コロンコロンスラッシュ、コロンコロンみたいな。
スピーカー 1
上位ディレクトリ。
スピーカー 2
1個上の階層に上がるみたいなのとか、
そういうのを今までだと覚えられないから、
1回1回検索して使ってたんだけど、
今はそれすらもいらなくて、
言ったら教えてくれるし、
聞いたら教えてくれるっていうのかな。
で、さっきみたいな、
すごい適当な自然言語、
本当に話すみたいな感じで、
TTWのパンドックしてって言ったら、
そのパンドックで過去にやったオプション付きのやつで、
目次階層2までやりました。
で、なんたらやめるを読み込んで、
設定を反映させました。
で、EPUB作りました、みたいな感じ。
スピーカー 1
そういえばさ、もう1個、
CSSを変えてもらったって言っとらんかったっけ?
スピーカー 2
CSSも変えてもらった。
スピーカー 1
横書きを縦書きに変えたんだよね。
スピーカー 2
そう、横書き、今までのiPadの本って、
アプリ名とかiPadっていう単語がやったら出てくるので、
縦書きの文章との相性がすごく悪く、
あえて横書きの本をずっと作ってたんだけど、
今回作ってる、書いて考える技術っていうのは、
もちろん写真も入ってるんだけど、
写真よりも文字の方が多いので、
普通に縦書きの右開きっていうのを、
一般的な日本の本の形にしたくて、
今まで使ってたオプションとか、
CSSをずっと使い回ししてるんだけど、
スピーカー 1
横書き前提になっているから、
レイアウトとかマージンとかも、
当然そっちに合わせてあるんだよね。
スピーカー 2
だから、これ縦書きの右開きにしたいんだよね、
みたいに言ったら、
作業を効率化するGemini CLIの活用
スピーカー 2
じゃあ、CSSはこう変えたらいいと思いますとか、
CSS以外のところでも、
縦書き横書き表記があるところはチェックして、
ここを変えるといいです、みたいな。
文字の起こしとかもやってくれるかな、そういえば。
スピーカー 1
文字の起こし?
2000って半画で入力しちゃうと、
文字が横向きに寝るっていう言い方をするんだけど、
2桁の場合は、それはCSSで回転させて、
20って書くようにしたりとか、
2000の場合は書き方悩むんだけど、
あえて全部全画で2000って書くとか、
そういうことを縦にする場合は、
結構めんどくさくってやっていたりするんだけど、
その辺もやってくれそうだね、うまいこと。
スピーカー 2
やってくれると思う。
自分の場合は、そんなに3桁、4桁の数字が出てこないので、
全部全画に置き換えようと思って、それも頼んだ。
数字を全画数字に変えて。
最初はそれだけ言ったら、
ファイル名のところ、画像の中の数字も全部変えられちゃったから、
本文だけにしようと。
本文だけにして、画像のファイル名とかオプションのところ、
プロパティのところとかは触らないで、
本文中の文章の中にあるA数字だけ、
全画に置き換えてほしいって言ったら、
一生懸命、検索方法を変えたりしながらやってくれてた。
スピーカー 1
あれ、正規表現でやろうととか、プログラムでやろうと、難しいもんね。
少なくとも俺、そんなやりたくないしね。
スピーカー 2
そう。だから、あ、こんなんでいいんやと思って。
だから失敗したとしても、戻してって言ったら、すぐ戻してくれるんだよね。
一回変更を加えたやつ。履歴で残ってるから戻してくれるし。
で、ちゃうんだよ。そこはダメなんだよって言ったら、
あ、わかりましたって。
そこだけが…
スピーカー 1
そこまでアホじゃないんやね。やっぱ全般的に。
スピーカー 2
うん。どちらかというと賢い方だと思う。
スピーカー 1
なんかさ、チャットGPTとかの罠にはまると、何回同じことを言ってもさ、
分かりました。直しますねって言って直さんとか。
スピーカー 2
直さんよね。チャットGPT。
スピーカー 1
よくある。一度なんか謎の壺に入るとさ、
もう新しいチャット作るしかないんだよねっていう。
スピーカー 2
そう、なんかバグってくるのか何なのかは、ちょっと原因はよくわからないけど、
たまにここだけをこうしてほしいっていう指示が通らない時があって、
で、さっき言ってたみたいに、新しいチャットに切り替えるとうまくいったりとかするんだけど、
なんかその辺のチューニングがGemini CLI使うとすごく簡単にできる。
少なくとも自分がやろうとしている作業に関してはすっごく相性が良くて、
スピーカー 1
今のところ良いことしかない。
スピーカー 2
まあ良いことしかないかな。で、なんかできるとは思うんだけど、
今そのEPUBで出力したやつをKindle ViewerとApple Booksに読み込んで、
ちゃんと出てるかどうかをチェックしながらやってるんだけど、
なんかKindle Viewerでさ、見たら目次のところがすごいデザイン崩れててみたいなやつは、
スクリーンショット撮って、
スピーカー 1
スクショでいい!そうか!
スピーカー 2
で、それは画像だから、画像が渡しやすいチャットGPTにそれ貼って、
で、元のファイル、EPUBとかCSSとかをそのまま入れて、
これさ、目次ちょっと変だから直したいんだけどって言ったら、
EPUBもなんか展開してくれて、中身勝手にチェックして、
ここにこういう表記があるから、ここを直すといいですよってCSSピロって出した。
スピーカー 1
EPUB渡したらいいんや、画像と。
スピーカー 2
うん、EPUB渡したらできた。
スピーカー 1
優秀やね。
スピーカー 2
なんか、EPUBを10分に変えて展開したらファイル見れますよとかって言われたんやけど、
スピーカー 1
EPUB実際そうだからね。
スピーカー 2
なんか自分の環境とうまく回答できんくって、
でも、あの、チャットGPT任せで展開して、
スピーカー 1
見て?
スピーカー 2
見て。
そしたらさ、もしよかったら直したやつ、EPUBにもう一回再変換しましょうかとかって言ってくれて、
スピーカー 1
原稿を直したいよね、オリジナルの。
スピーカー 2
まあまあ、だから最終それでもいいのかなって思って。
で、直してくれたやつとかは綺麗になってたりするから、
スピーカー 1
いろんな苦労がこの数年で最初期の人力で間違いがないか読み換えしてきた頃を思えば。
スピーカー 2
うん、とか、そのCSSがさ、うまく反映されんくってなんやこれはってなってたのが、
あの、すっごくスムーズにできるようになって、
ああ、これはいい時代になったなって思った。
スピーカー 1
そうだよね、まだ最初にKDP出した頃はなかったもんね。
スピーカー 2
なかった、なんか電電コンバーターとか使って、
スピーカー 1
ファンのプランも使ってなかった。
ファンのプランも使ってなかった。
今なら、そっか、電電コンバーターは非常に素晴らしいんだけど、
やっぱ毎回アップロードせんとさ、確認できんからさ、やっぱその手間が面倒。
やっぱローカルで動かした方が早いなってなっていったんだ。
スピーカー 2
変わりましたね、だいぶ。
で、まあ、年に1,2回はこういう本を作る作業みたいなのがあるんだけど、
前回作った時はさ、チャットJPTはもちろんあったけど、
ジェミニCLIはなかったし、使えてなかったから、
今回初導入って感じなんだけど、めちゃくちゃ便利やなって。
スピーカー 1
まあ、とにかく画像問題が解決して、
はるながやらんくなるのが止められるっていう、
そんだけでなんかいいことな気がするわ。
それが嫌だからやらんってずっと言っとったもんね。
スピーカー 2
そうだってめんどくさいもん。
ということで、今日はジェミニCLIっていう、
直接ちょっとiPadでは今使うことができないので、
なんかそのパソコンでっていう話にはなるんだけど、
それを使ってファイルを操作するというのが非常に賢く便利にできるようになって、
楽しく作業が進んでいるよというお話でした。
EPUBファイルの編集と効果
スピーカー 2
番組への感想やリクエストなどは、
シャープiPadワーカーズのハッシュタグをつけて投稿してください。
それではまた来週、iPadワーカーズことたくさん。
iPad、iPad、iPad、iPad。
26:48

コメント

スクロール