スピーカー 1
スピーカー 2
{openStarringSelector = false;})"
wire:loading.class.remove="cursor-pointer"
wire:loading.class="cursor-wait"
aria-label="出演者を紐付ける">
Haruna Goto (haruna1221)
{openStarringSelector = false;})"
wire:loading.class.remove="cursor-pointer"
wire:loading.class="cursor-wait"
aria-label="出演者を紐付ける">
goryugo
スピーカー 2
iPadの言葉と、iPad Onlyなポットキャット、iPad Workersポットキャット、今日はGEMINI CLIの話パート2をします。
スピーカー 1
ハマっていますね、だいぶ。
スピーカー 2
そう、今やってる作業とすごく相性が良くて。
スピーカー 1
あ、そうか、コマンドライン的な何かと相性が良いことがあれば、それはめちゃめちゃ相性が良い。
スピーカー 2
前回はGEMINI CLIを使ってみたくてというので、導入が目的って感じで、何ができるかなっていうので、
1ヶ月間のiPad Workersで配信したニュースレターをまとめる記事みたいなのを自動で作るみたいなのをやってみたのね。
スピーカー 1
まあそれだけでも単純に結構だいぶ優秀だよね。
スピーカー 2
それで、すごい良いじゃん、すごい使いやすいじゃんって思って、
今ですね、取り組んでいるプロジェクトが、書いて考える技術っていうナレッジスタック、
ゴリゴさんのニュースレターやってる、ニュースレターのサブスタックでやってるナレッジスタックに、
月に1回原稿を寄稿するみたいな形でやってたのが10何回分溜まってて、
それを本にしようっていう形で今プロジェクトをやっているんだけど、
その原稿というのが全てマークダウンファイルで、オブシリアンで全部執筆しているので、
オブシリアンの中に全部入っているので、要はローカルで全部ファイルを持っている状態。
Gemini CLIを使って、本の原稿の元になるやつを1個のフォルダの中に分かりやすく、
これは別にしなくてもいいんだけど、
スピーカー 1
ブックとか原稿をフォルダに入れとくんだよね、分かりやすく。
スピーカー 2
そう、TTW、Thinking, Thought, Writing。
スピーカー 1
そんなんであるのは分かる?
スピーカー 2
分かんないけど、TTWって頭文字付けとけば、
オブシリアンとかファイル検索するときにやりやすいし、
実際、英語圏では書いて考える技術みたいな、書きながら考えるみたいなので、
ハッシュタグとかもあって、TTWっていう。
スピーカー 1
一般語なんだ、TTWっていうのは。
スピーカー 2
らしいよ、チャットGPTに。
スピーカー 1
アズリーワードっていうのかな。
スピーカー 2
実際にそうやって使われているのであれば、
その文字列使っておくのでいいかなと思って、
プロジェクトTTWが今ある。
スピーカー 1
プロジェクトTTWフォルダに原稿があって、
めっちゃ楽やん、パンドックをジェミニーにやってもらえばいいってことでしょ。
スピーカー 2
そう、しかもそれコマンドなんだけど。
スピーカー 1
コマンド覚えてないから、いつも履歴から取り出してくるんだけど。
スピーカー 2
そう、でもジェミニー賢いから、
パンドックしてって、自然言語でいいの?
スピーカー 1
このフォルダをパンドックでまとめてEPUBにして、で、いい。
スピーカー 2
パンドックしてって通じた。
スピーカー 1
語彙力いらんのや。
スピーカー 2
さらに言うと、今ずっと自分で作ってきてた電子書籍っていうのは、
パンドックっていうコマンドを使って、
マークダウンファイル、原稿をEPUBファイルにまとめる。
変換するみたいなことをやってるんだけど、
それがジェミニーCLIを使うとむちゃくちゃ簡単にできるし、
パンドックするためには、
普段書いているObsidianの中で書いている表記だと、
上手くその画像とかが出なかったりする。
スピーカー 1
Obsidianの表記だとダメで、
マークダウンの正規の書き方に変えんといかんってやつやね。
スピーカー 2
それをしないといけなかったりとか、
あとはファイルが参照できるように、
ファイルを相対パスにしないといけないとか、
スピーカー 1
いろんな細かな修正作業があったの、今まで。
画像を集めてきて、imgっていうフォルダ作って、
その中に画像を入れておいてっていう中で、
もともと画像リンクだったやつをimgの中の何とかjpegにして、
とかってやらなきゃいけなかったよね。
スピーカー 2
それがすごいめんどくさくて、
今まではObsidianのプラグインを使って、
一回マークダウンファイルをエクスポート、書き出すってすると、
一セットにマークダウンファイルと画像ファイルを改めて書き出して、
一個にまとめてくれるプラグインみたいなのを使って、
それで最終、画像とマークダウンファイル、
ちゃんとした指定になっているマークダウンファイルを準備して、
単独して本の形にしてたっていうのが、
今、Gemini CLIに、このマークダウンファイルの中に入っている画像を集めて、
このフォルダに動かしてって言ったら、
分かりました、じゃあファイルを見てみますねって言って、
ファイルの中をチェックして、
このファイルの中にはこの画像とこの画像とこの画像が入ってましたって言って、
ファイル名を3つ出てきて、
じゃあそのファイルがどこにあるか今からチェックしますって言って、
検索して、ファイルを検索して、
見つかったんで、これをこのファイルにムーブします、動かします。
動かしてもいいですか、コマンドを使ってやってもいいですかっていうのまでやってくれる。
スピーカー 1
あれじゃん、はるながずっと電子書籍を作るときに一番やりたくないって言ってくれたやつを全部やってくれとるやん。
スピーカー 2
そうなんですよ。
スピーカー 1
一番嫌だって言っとったよね。
スピーカー 2
一番嫌だって言って、
しかも私の原稿はゴリゴさんの原稿に比べて画像がものすごく多い。
その画像を何とかして集めてくるのがすごい大変みたいにずっと思ってたのが、
Gemini CLIに頼むと、
スピーカー 1
待っといたらいい。
スピーカー 2
そう、待っといたらいい。時間はかかる。
もちろんチェックしてくれてる時間分、やりとりの時間がかかるんで、
スピーカー 1
自分でプログラム書いたらもっと早いんだよね、実際に動作自体は。
スピーカー 2
ただファイルを探すのとかも、
例えば探してとかっていう適当な指示で、
ちゃんとそれを理解して、検索して、
検索したけどうまく見つかりませんでしたってなったら、
じゃあ検索方法をちょっと変えてみますわって言って、
自分で考えてやってくれる。
スピーカー 1
ここ以下にあるよとか教えてあげたりもしてないんだ。
オグシディアンボルトの中にはあるはずみたいなこと。
スピーカー 2
2,3回チャレンジして見つけられなかった場合は、
ちょっと私見つけられなかったんで、
よかったらそのファイル、画像ファイルが入っている場所を教えてもらえませんかって言ってくる。
スピーカー 1
だから基本はるなは待っといたらいいんや。
待っといてちょこっとお仕事をしてあげればいいんや。
スピーカー 2
だからその間に別の原稿の修正とかをしておいて、
その指定しているファイルは勝手に綺麗になって、
画像も動かされててみたい。
スピーカー 2
じゃあ、CSSはこう変えたらいいと思いますとか、
CSS以外のところでも、
縦書き横書き表記があるところはチェックして、
ここを変えるといいです、みたいな。
文字の起こしとかもやってくれるかな、そういえば。
スピーカー 1
文字の起こし?
2000って半画で入力しちゃうと、
文字が横向きに寝るっていう言い方をするんだけど、
2桁の場合は、それはCSSで回転させて、
20って書くようにしたりとか、
2000の場合は書き方悩むんだけど、
あえて全部全画で2000って書くとか、
そういうことを縦にする場合は、
結構めんどくさくってやっていたりするんだけど、
その辺もやってくれそうだね、うまいこと。
スピーカー 2
やってくれると思う。
自分の場合は、そんなに3桁、4桁の数字が出てこないので、
全部全画に置き換えようと思って、それも頼んだ。
数字を全画数字に変えて。
最初はそれだけ言ったら、
ファイル名のところ、画像の中の数字も全部変えられちゃったから、
本文だけにしようと。
本文だけにして、画像のファイル名とかオプションのところ、
プロパティのところとかは触らないで、
本文中の文章の中にあるA数字だけ、
全画に置き換えてほしいって言ったら、
一生懸命、検索方法を変えたりしながらやってくれてた。
スピーカー 1
あれ、正規表現でやろうととか、プログラムでやろうと、難しいもんね。
少なくとも俺、そんなやりたくないしね。
スピーカー 2
そう。だから、あ、こんなんでいいんやと思って。
だから失敗したとしても、戻してって言ったら、すぐ戻してくれるんだよね。
一回変更を加えたやつ。履歴で残ってるから戻してくれるし。
で、ちゃうんだよ。そこはダメなんだよって言ったら、
あ、わかりましたって。
そこだけが…
スピーカー 1
そこまでアホじゃないんやね。やっぱ全般的に。
スピーカー 2
うん。どちらかというと賢い方だと思う。
スピーカー 1
なんかさ、チャットGPTとかの罠にはまると、何回同じことを言ってもさ、
分かりました。直しますねって言って直さんとか。
スピーカー 2
直さんよね。チャットGPT。
スピーカー 1
よくある。一度なんか謎の壺に入るとさ、
もう新しいチャット作るしかないんだよねっていう。
スピーカー 2
そう、なんかバグってくるのか何なのかは、ちょっと原因はよくわからないけど、
たまにここだけをこうしてほしいっていう指示が通らない時があって、
で、さっき言ってたみたいに、新しいチャットに切り替えるとうまくいったりとかするんだけど、
なんかその辺のチューニングがGemini CLI使うとすごく簡単にできる。
少なくとも自分がやろうとしている作業に関してはすっごく相性が良くて、
スピーカー 1
今のところ良いことしかない。
スピーカー 2
まあ良いことしかないかな。で、なんかできるとは思うんだけど、
今そのEPUBで出力したやつをKindle ViewerとApple Booksに読み込んで、
ちゃんと出てるかどうかをチェックしながらやってるんだけど、
なんかKindle Viewerでさ、見たら目次のところがすごいデザイン崩れててみたいなやつは、
スクリーンショット撮って、
スピーカー 1
スクショでいい!そうか!
スピーカー 2
で、それは画像だから、画像が渡しやすいチャットGPTにそれ貼って、
で、元のファイル、EPUBとかCSSとかをそのまま入れて、
これさ、目次ちょっと変だから直したいんだけどって言ったら、
EPUBもなんか展開してくれて、中身勝手にチェックして、
ここにこういう表記があるから、ここを直すといいですよってCSSピロって出した。
スピーカー 1
EPUB渡したらいいんや、画像と。
スピーカー 2
うん、EPUB渡したらできた。
スピーカー 1
優秀やね。
スピーカー 2
なんか、EPUBを10分に変えて展開したらファイル見れますよとかって言われたんやけど、
スピーカー 1
EPUB実際そうだからね。
スピーカー 2
なんか自分の環境とうまく回答できんくって、
でも、あの、チャットGPT任せで展開して、
スピーカー 1
見て?
スピーカー 2
見て。
そしたらさ、もしよかったら直したやつ、EPUBにもう一回再変換しましょうかとかって言ってくれて、
スピーカー 1
原稿を直したいよね、オリジナルの。
スピーカー 2
まあまあ、だから最終それでもいいのかなって思って。
で、直してくれたやつとかは綺麗になってたりするから、
スピーカー 1
いろんな苦労がこの数年で最初期の人力で間違いがないか読み換えしてきた頃を思えば。
スピーカー 2
うん、とか、そのCSSがさ、うまく反映されんくってなんやこれはってなってたのが、
あの、すっごくスムーズにできるようになって、
ああ、これはいい時代になったなって思った。
スピーカー 1
そうだよね、まだ最初にKDP出した頃はなかったもんね。
スピーカー 2
なかった、なんか電電コンバーターとか使って、
スピーカー 1
ファンのプランも使ってなかった。
ファンのプランも使ってなかった。
今なら、そっか、電電コンバーターは非常に素晴らしいんだけど、
やっぱ毎回アップロードせんとさ、確認できんからさ、やっぱその手間が面倒。
やっぱローカルで動かした方が早いなってなっていったんだ。
スピーカー 2
変わりましたね、だいぶ。
で、まあ、年に1,2回はこういう本を作る作業みたいなのがあるんだけど、
前回作った時はさ、チャットJPTはもちろんあったけど、
ジェミニCLIはなかったし、使えてなかったから、
今回初導入って感じなんだけど、めちゃくちゃ便利やなって。
スピーカー 1
まあ、とにかく画像問題が解決して、
はるながやらんくなるのが止められるっていう、
そんだけでなんかいいことな気がするわ。
それが嫌だからやらんってずっと言っとったもんね。
スピーカー 2
そうだってめんどくさいもん。
ということで、今日はジェミニCLIっていう、
直接ちょっとiPadでは今使うことができないので、
なんかそのパソコンでっていう話にはなるんだけど、
それを使ってファイルを操作するというのが非常に賢く便利にできるようになって、
楽しく作業が進んでいるよというお話でした。