1. ごりゅごcast
  2. 🎙786 ObsidianとCursorを連携..
2025-03-14 29:46

🎙786 ObsidianとCursorを連携してAI執筆環境を整える

spotify apple_podcasts

サマリー

本エピソードでは、プログラマ向けのAIエディター「Cursor」とObsidianの連携による執筆環境の構築について話しています。Cursorの機能や使い方、自身の執筆スタイルに合わせたAIの活用方法について具体的な体験を共有しています。このエピソードでは、ObsidianとCursorを活用したAIを利用した執筆環境について議論しています。特に、生成AIを使用した文章作成の効率化や、自分の作業スタイルに合ったツール選びの重要性が強調されています。また、ゴリゴさんとはるなさんがAIを利用した執筆環境の整備について話し、特にObsidianとアトミックシンキングワークシートの重要性に焦点を当てています。さらに、言語能力と読み書きの力がAIとの効果的なコミュニケーションに欠かせないことが強調されています。

CursorとObsidianの初体験
スピーカー 1
こんにちは、ごりゅごキャストです。今日はCursorっていうプログラマ向けのAI系エディターを文章用に書くっていうのを試してみた話をします。
スピーカー 2
Cursorっていうテキストエディター、コードエディターっていうのが正しいのかな?あれってアプリだけ?ウェブからも使える?
スピーカー 1
アプリオンリー?どうやらなんかね、Obsidianの人界隈でね、とても相性がいいって話題になっているっぽくって、
なかなか腰が重くて手を出せなかったんですが、たまたま見た記事で明確に文章を書くのにすげー使えるぞっていうのを見て試してみたら、
ちょっと工夫をするとObsidianでもかなり快適に、Obsidianと一緒に使うっていうのもかなり快適にできて、
自分的にはついにAIと共存して書くというものを日常化できるのではないかと感じた。
スピーカー 2
Cursorっていうコードエディターが、そのAIを組み込んで、コードを直してくれるとか、考えてくれるとか、そういうのを売りにしているエディターで、
でも別にテキストが打てるだけだから、文章を書くにも使えるんじゃないかって言って使ってる人が一部いるって感じだよね。
スピーカー 1
なので一般的な認識はプログラマーが使うと考えて間違いないし、実際、ベースがVSCodeをベースにして改良・改造を加えているエディターみたいな感じなので、
使用感もすごくVSCodeっぽくて、プログラマチックな使い心地っていうのかな。拡張機能とかも同じものが使えたりだとかっていう意味で、
プログラマーっぽいって感じるんだけど、実は記事で読んで面白かったのが、プログラミング言語も日本語もどっちも言語なんだから、
生成AIはどっちもうまく扱える。保管機能とかもうまく機能するし、文章の構成とかにもうまく機能するしっていう感じのことを言っていて、
まだ使った期間で言うと1日半なので、最速体験レビューみたいな感じにしかならないんだけど、
第一印象として、まずやっぱ初めてこれなら自分も使えるというか、自分の身体感覚にフィットするツールだったってまず思った。
大雑把にObsidianみたいに左と右にウィンドウがあって、真ん中がメインの画面っていう作りになっているんだけれども、
左がファイルだったりGitだったり拡張機能だったりっていうようなものに使うサイドバーで、
右側サイドバーがそのAIチャット専用になっているって言えばいいのかな。
そこになんかチャットで文字を打ち込むと、生成AIが質問とかに答えてくれる。
これがAIの使い方その1なんだけど、それよりも大変素晴らしいなと思うのが、
ファイルを開いておいて、範囲選択をした後、コマンドKを入力してあげるとポップアップウィンドウみたいなのが出てきて、
これを構成してとか、ここを見出しつけてとか、この文章をもうちょっと読みやすくしてみたいなことをすると、
その部分だけをその前後の文脈を踏まえた上で修正してくれて、
OKならコマンドエンター、ダメならバックスペースを押してください、みたいな感じで色々と試行錯誤が直接スムーズにできるっていうのかな。
もう1個が書いている途中に勝手に文章の続きを書いてくれて、タブを押すとその文章がそのまま確定できる。
大雑把に言うと、そのいわゆるAI補助みたいなのは、その3種類のやり方があるって感じ?
スピーカー 2
はるなさんは話だけ聞いてて、あとはその記事とかだけを見て、カーソルというエディター、コードエディターがあるっていうのは知ってるんだけど、
実際には使ってないので、想像だけの話で言うと、自分の場合だとチャットJPTのキャンバス機能っていうのが出た時に、
そういうエディティングしながらAIを使うとか、この部分の続きを書いてくださいとか、選択範囲してこれを何たらに変えてください。
例えば過剰書きで出てきてた生成文章の結果を、過剰書きじゃなくて普通の文章に直してほしいみたいな時は、そこだけ選んで、これを普通の文章に変更してって言ったら、そこだけをピーって書き換えてくれて、
キャンバスの場合、決定とキャンセルみたいなのはないんだけど、履歴っていうので戻ることができるから、変えてもらった後に何か微妙だなと思ったら、一個前のバージョンに戻して、もうそこからもう一回やり直すとか指示を変えるとかっていうことができるので、
自分の場合だとキャンバス上で編集をするが十分使えてて、それで多分カーソルを使うにいかなかったんだけど、雰囲気としてはそれに似てるって感じなのかな?
スピーカー 1
多分純粋な機能みたいな話で言えば、ほぼ同じ。強いて言うならそのタブがないみたいなところは違うかもしれないんだけど、多分機能はほぼ同じで、
なんかやっぱね、もういろいろと自分なりに生成AIを使ってみて分かったのが、結局やっぱできるかどうかとかっていうよりも、自分の身体感覚にマッチするかどうかっていうの。
例えばキャンバスで自分の場合、文章を書き始めていって、そのまま続きを書いて後から直そうというのは、どうも感覚として肌に合わない。
書き終わった文章をペッて貼って、それを直してくださいみたいなやり方ならいいんだけど、今自分が試してみた感じで言うと直接エディターで書きながら直しているみたいな感覚があって、
そこがどうもちょっと感覚が違うみたいな話だったり、同じくObsidianからどう開くかっていうことなんだけど、普段使っているのはやっぱObsidianなんだよね。
AIを使った編集機能
スピーカー 1
で、オープン・デフォルトアップっていう、標準のアプリで開くっていう機能があるじゃん。
あれを併用してあげれば、ショートカットキー一発でこのファイルをカーソルで開くということができて、そのまま編集をしてObsidianに戻れば編集したものがまた返ってくるみたいな、
すごくちょっとしたことなんだけど、距離感の近さというか、直接自分のファイルを編集しているという感覚があって、
それがね、ChatGPTのキャンバスだと、やっぱり一回自分のものを持って行って、やってきたらまた元に戻すみたいなことが必要の、
そのちょっとしたところが結構自分にとっては重要な大きな違いなんだなって思った。
スピーカー 2
それは結構大きな違いだと思う。
あくまでChatGPTをさ、APIで呼んできて処理してくれるエディターっていうのも、iPadアプリとかだと結構あったりして、
そういうのだと、自分のそのアプリの中で編集を加える、何か考えてもらうっていうのができるから、移動感っていうのは少ないんだけど、
今自分の使い方で言うと、やっぱりその今のような使い方をしようと思ったら、Obsidianのファイルから多分コピーして、本部のところコピーして、
で、ChatGPTに貼って、
スピーカー 1
戻ってきたやつも同じ部分だけは書きせんとあかんよね。細かい話だけど。
スピーカー 2
それはある。今、はるなさんがやってる作業としては、すでにある文章をキャンバスに持ってって、そこで何かするっていう作業はほぼなくて、
基本、ChatGPTからスタートしているものをキャンバスで開いて、キャンバス上で整えて、
で、それを最後、コピーっていうとこまでしてくれるから、コピーしてもらったやつをObsidianのファイル名なんかつけたやつにペタッと貼る、みたいな感じのフローで、逆がないんだよね。戻すことがなく。
スピーカー 1
戻す。
スピーカー 2
Obsidianからもう一回、また時間を空けて、ChatGPTの方に戻すみたいな作業はない。
スピーカー 1
ないんだ。
スピーカー 2
ない。
スピーカー 1
やっぱ、あれだよね。根本的に始め方から全然違うってことだよね。
スピーカー 2
始め方は基本的にChatGPTから始まるものが多い。
スピーカー 1
でしょ。俺、そういう意味で言うと、そのChatGPTから文章を書くという行為において、ChatGPTから始まることは考えたことがなくて、
やったことがないから分からない。やろうと思いつかなかったっていうのがあって、まずアイディアのメモみたいなものがあるとか、
ざっと、ざっくりこんな感じのことを書こうってメモが残っているとか、そういうものが存在している前提になっているので、
その場合、やっぱエディタースタート、エディターエンドであることがとても重要で。
スピーカー 2
自分の場合は、まあそういうものも確かにゼロではない、あるんだけど、ここ最近の、例えばそのニュースレターの原稿とかで言うと、
基本はChatGPTとの会話からスタートする。
例えば、なんかのウェブの記事を見ながらとか、本を読みながら、なんか面白いフレーズだなとか、こういう考え方もあるんだみたいなのがあったら、
ChatGPTとの使い分け
スピーカー 2
それをChatGPTに向かって喋ります。その本文そのままだったりとか、本に書いてあることをそのまま読み上げるとか。
で、これについて、なんかこうこうこうなんだけど、私はこうこうこうなんだけど、どう思う?みたいな感じで、普通にさ、なんか会話するみたいな感じで喋りかけて、
で、向こうがなんかいろんなことを返してくれるわけよ。
で、その返してくれたものとかも参考にしながら、じゃあこういうこういうことなんかなとか、なんかその会話からスタートして、
で、そこから、これ多分ニュースレターにしたらなんか面白そうみたいな感じになって、じゃあこれでニュースレター書いてみたいな感じに持ってくことが多い。
スピーカー 1
やっぱさ、なんかあの生成AIとの距離感がだいぶ違うだろうなっていうのをやっぱ思うね。
スピーカー 2
多分ね、その使い方というか根本的に多分その違うと思うし、これは本当人それぞれでどれが正解とかもなくて、
まあ自分がその使いやすいものとか距離感とか使い方とかがまあいろいろあるとは思う。
ただ自分の場合だと、まあそういう時だいたいiPhoneなんだけど、まあiPhoneでちょっとJPTのアプリ立ち上げて、
とりあえずバーってなんか喋ったりとか書いたり、まあそれがメモになったりもするね、そのなんかメモして覚えておきたいみたいなときに、
とりあえずそこで喋っといて、履歴っていうか出る、残るじゃんテキストとして、でそのやり取りをベースにして、
でまあそこからなんか発展させたい場合は、 アプリだとちょっと難しいんだけど、
web 版だとその自分が作ったJPT図にそれを渡すみたいなのも簡単に呼び出すっていうので、
呼び出せるから、それであっと何々みたいな感じでやって、 これで書いてとか、あとこれで画像を作ってみたいな。
スピーカー 1
あーそっか、思いつきネタを溜めておくみたいな概念がノートじゃなくて、 ネタをチャットJPTと話しながら考えていてっていう、
スピーカー 2
それチャット履歴すらもうネタ調になっているってことなんや。 そう、だからチャットJPTにプロジェクト機能というのがついて、
スピーカー 1
めちゃくちゃ使いやすくなった。 なんか喋ってたチャット履歴を後からプロジェクトに入れられるっていう。
スピーカー 2
だからネタ調、それもネタ調なんだ。 そう、だから今そこに基本本の原稿とかになるんだけど、
アプリ図鑑用のプロジェクトと、あと書いて考える用のプロジェクトと、 あとは絵を書くってか、原稿全般を書くためのプロジェクトと、
スピーカー 1
3つぐらいはあのめちゃくちゃよく使ってる。 あーそういう風なのね。
やっぱ自分の場合そういう意味で言うと、生成AIと文章を直してみたいなのが結局ずっと相性が良くなかったから、
そのチャットJPTで一番使ってるの音楽の話でさ。 こういう、こういうような曲好きだったらどうしたらいいとか、こういうのに似たようなやつ何があるとか、
こういうジャンルの音楽の歴史とか有名な人とか曲とか知りたいんだけどとか、
なんかそのDAWを使ってこんな感じの音を作るにはどうしたらいいんだろう、みたいなことがめちゃくちゃ多くて、
やっとそのカーソルによって、
アウトプットのために、生成AIを使うということができそうになってきたっていうのかな。
スピーカー 2
まあその使い方というか、自分の好き嫌いみたいな、まあ性に合う合わないとかっていうので、結構さそのツール、
例えば同じObsidianを2人とも使っているけれども、 まあ全然違うよね、本当に全く違うアプリなんじゃないかっていうぐらい面白いぐらいに、
使い方から入れているプラグインから、その書いていることから、全然やっぱ違う。
でそれっていうのは自分がやりたいことを好きなようにやっていると、まあそうなってくるわけだから、
今回そのカーソルがすごい自分に合ってたっていうのも、合う人もいれば合わない人もいると思うけど、
ハマる人にはめっちゃハマるんじゃないかなって思ったし、 ただあれだよね、カーソルのそのAI機能って有料じゃないと使えないんじゃない?
生成AIとの向き合い方
スピーカー 1
えっとね、いわゆる右側チャットの一番しょぼいやつならどうやら無料で使えるっぽい、
その直接範囲指定して直してとかっていうのは、 回数制限があるっぽい、
タブで保管するのも、無料では2000回使い切ったら、もう有料にせんとあかんとかだったかな。
なので、長い目で見たらほぼ有料が必須になると思う。 ちゃんと使うなら。
でもダウンロードして、最初の方はフル機能を使えずに使える。
その使えている、特にその苦労することなくっていう感じかな。
あとね、同時にね、すごく思ったのがね、 例えば自分がObsidianでやっているもう一つ重要なこととして、
紙に書いた読書メモをデジタル化してノートを分けるっていうことを自分でやっているんだけれども、
それさ、そのデジタル化っていうのはどういうデジタル化?
紙のノートに書いた読書メモを具体的に言うと、写真に撮ってObsidianに貼り付けて、
その写真を見ながら自分で文章を書いて、もう一度書き起こして、それをそのタイトルをつけて細かなノートに分けていく。
スピーカー 2
その写真は消さないの?別に。
スピーカー 1
大体消す。もういらんくなるから消すっていう感じ。
まあ、ということをやっていて、これは生成AIでやっても何の意味もないことだなっていうことも同時に思って、
その面倒くさいし大変なんだよね。紙の手帳に書いてあることを自分でいちいちまとめ直して、タイトルつけてノート分けて、
さらにそこの文章ももう一回自分で考えてっていうことをやっていたり、どうやって分けたらいいだろうとか考えていたりしていて、
これは生成AIでやったつもりになっても何の役にも立たんことだなって同時に思って、
その安易にAIに頼ることの危うさと境界線の引き方っていうのがめちゃくちゃ重要だなっていうことはすごく思った。
スピーカー 2
多分技術的には普通に画像をチャットGPTとかにポンって投げて、書いてあることを抽出もできるし、
ようやくまとめてっていうふうにすればめちゃくちゃ速攻ブワーってやってくれて、見栄えのいいものに変えることはすごく簡単にできると思う。
ただ、実際はるなさんもそれはやらない。やってないしやらない。
スピーカー 1
でね、残念ながらウェブで見かける記事の多くが、それやってやった場合できたって言ってる人が多い印象を受けていて、自分は。
スピーカー 2
AIの使い方的な話で。
スピーカー 1
そうそう。例えばそのオブシリアにKindleハイライターっていうプラグインがあって、Kindleのハイライトをそれで集めてきて、
そのハイライトを集めて、AIに渡してまとめてとかって言っとくと、すごいやったかっこいい読書メモができたみたいな感じのことをやっている人が多いような印象を受ける。
スピーカー 2
そうか、自分がやっぱりそういうの全然いらないってわかってから興味がなくて、そういう情報を調べないからっていうのもあって、入ってこなかったから、そういう人たちがいることをあんまり意識してなかったけど、まあそうかって感じ。
スピーカー 1
やっぱ思ったのが、これからの時代で自分に合ったAIをちゃんと見つけるっていう難しさと、どこに境界線を引くのか、何を一緒に頼るべきで、何を自分でやらないといけないかということを判断しないといけないのは、それもAIに相談すればいいかもしれないんだけれども、その依存度っていう言い方とも違うんだけど、
えっと、指示を出すのはまだ人間だからさ、その人間の能力を上げないとダメというか、限界が訪れるわけじゃん。
文章の質と指示の重要性
スピーカー 2
それはね、やっぱなんとなくだけど、自分の中でもあって、そのKindleのハイライトとかでも、昔はなんかハイライトをなんか抽出っていうか、全部一冊分のなんかハイライトを取り出して、一個にファイルにするとか、そういうのもなんかいろいろ試したことはあったけど、結局それやっても本当に何も残らなくて、
スピーカー 1
そのかっこいいノートが残る、自分の脳内に何も残らないんだよね。
スピーカー 2
自分の頭の中に何も残らなくて、結局その頭の中に残ってなければ、その後他に関連する、例えば本を読んだとか、何かの話を聞いた時に、その引っかかってこないっていうところが全然ダメだなと思って、
自分の場合はそういうことをやらなくなったし、その今の自分のAIを使ったなんかっていうのも、文章を書くっていうので言うと、多くの人はなんかAIでもう一瞬で書き上がって、もう全然手間かけずに楽できてすごいみたいなことを言ってるんだけど、
スピーカー 1
それは誰もが書けることの何の価値もないものを書いているだけだから。
スピーカー 2
それはやっぱ違うなっていうのは自分の中であって、自分のそのAIとの向き合い方というか境界線っていうのは、今まで自分が文章を書くときに一番ストレスだったのって、日本語が正しいかどうか、その文法的にこういう言い方をすると何かダメとか、何から抜き言葉かとか
スピーカー 1
文法っていうか、はるなが書いている文章で、なんでそんな変な日本語なのって思うことはめっちゃあったよ。
スピーカー 2
そう、だから自分のこと日本語不自由って言ってたんだけど、このしゃべるのはさ、そんなに残らないから気にならないんだけど、文章テキストとして残るとどうしても見えてしまうから変だなって思う人はいるし、自分でもやっぱ変だなって思うんだけど、
どうしたらいいか分からない。
どうしたら正解なのかを調べないといけなくって、調べて直してっていうのがすごくストレスだったわけ。
でもそれがAIを使うようになってから、何が一番良かったかって、そこを気にせずに書けるようになる。
スピーカー 1
とりあえず書いて、変な文章を元に直してくれっていう。
スピーカー 2
そう、だから文章とか結構途中段階で慣れちゃったら勝手に補完してくれるっていうか、その続きをいい感じに書いてくれるから、書きたいことっていう軸になる部分は全部自分で書いてる。
でもそのはしばしっていうか細かいところの、これはちょっとこういう表現も別に悪くないけどこっちの方が一般的ですよとか、
ここはこのら抜き言葉になってるから直しますよとか、ちょっとここは交互的な表現すぎるので、こういう言い方どうですかみたいな感じで、めちゃくちゃ直してくれるっていうかアドバイスしてくれるし、正解も教えてくれるから、それがものすごく良かった。
スピーカー 1
俺もね、昨日今日でね、書いてもらうの試すとね、やっぱね、文章がね、何も言わないとね、全部いい子ちゃんの文章でね、クッソつまんないんだよね。
で、そういうのは嫌だから、やっぱ直さないといけないし、そこに適切な指示を出して、ポサを残さないといけないと思っていて。
でね、最近思いついた、自分用のポジショントーク的な要素があることは否定しきれないんだけれども、今の時代に最も重要な能力とは何だろうって考えた時に、
AIと言語能力の重要性
スピーカー 1
えっとね、思っていることを言語化できることなのではないかと思っていて、そのチャットGPTに言語を使って適切な指示が出せることというのが、今の社会で何ていうの、最も成果を上げることに直結するというの、重要な能力なんじゃないかということを考えるようになってきていて、
ということはやはり各能力を上げないといけないんだな、読み書きの能力を上げていかないといけないんだなっていうふうに思い至った。
スピーカー 2
そういう読み書きの力ってさ、何にでも使えるし、マジで万能やと思う。
スピーカー 1
そしてですね、読み書きの能力を上げるためには、ゴリゴさんが最近作ったオブシディアン、アトミックシンキングワークシートを使って、やっぱり読み書きの能力というものをできるようにしていかないといけないっていう話とも、ちゃんと繋がるやんと思って。
スピーカー 2
あとはるなさんが書いている、書いて考える技術っていうのを、たぶん今のところアナログより。
スピーカー 1
あれは図解するからさ、自分のポジションに寄せた表現で言うなら、あれをちゃんとGPTがそのまままだ理解するのは難しいから、文章にできないといけないんじゃないかなと俺は今思っている。
まあやってくれるけどね、今はそういうこと。
でもたぶん、はるなの話で言うと、文章化するためにその前の段階としてああいうふうに書くことが得意な人、好きな人もいるし、そもそも人間の脳内で先にその処理をしておいた方がいいタイプの人とかそうじゃない人とか色々いるから。
スピーカー 2
これも結局その好き嫌いとか自分に合う合わないのタイプっていうか相性だと思ってて、どっちかというとゴリゴさんは多分言語よりの思考とか考え方とか全てのベースがその言語っぽいんだよね。
スピーカー 1
ぽい?どうやら。
スピーカー 2
対してはるなさんはどっちかというとビジュアルよりなんだよね。
スピーカー 1
空間的だよね。
スピーカー 2
もちろん言語も使うし自分でも書いてるからそっちも伸びてるとは思うんだけど、基本の基本っていうの自分がやっぱ直感的にわかりやすいなって思うのは文章よりも図とか色とかまあなんか簡単なやつでいいんだけどその図解してあるやつの方がわかるんだよね。
スピーカー 1
だからあのインスタントラーメンの裏の作り方が。
ラーメン作れへんなマジで。
スピーカー 2
あれが本当に無理でテキストっていうか文章で書いてある。
スピーカー 1
あれはちなみに大体わかりにくい。マジダメだと思う。
スピーカー 2
あれがさ本当何回言うんだろうな。
スピーカー 1
さらにその文脈理解っていうかなんかインスタントラーメンの作り方という広いワールドをやっぱり理解しないといかんみたいななんかそういうのがある。
スピーカー 2
で逆になんかそこが絵がいっぱい入ってる作り方の説明のやつだとあのイケる。
スピーカー 1
絵見てなんか逆に全然違うことやっとったりしたもんね。
スピーカー 2
それもたまにある。
スピーカー 1
読まんのやと思って。
スピーカー 2
読まんのじゃない読めんのよ。
スピーカー 1
あーていうことなんだよね。
スピーカー 2
あの読んでも本当にわからない。あの理解できないっていうのが。
スピーカー 1
あったね。はるなが前インスタで見つけたなんかレシピの動画を見せてもらったけど俺理解できんかったもんなあれ。
スピーカー 2
あーそうそうそう。そのはるなさんは。
スピーカー 1
日本語で書いてあったけどマジわからんかった。
スピーカー 2
ビジュアルしか見てないからそのインスタの流れてきた動画をパラパラ見たらあーこんな感じね、こういう手順でやるのね、量はこれぐらいねっていうのが感覚でわかってわかりやすいって思うんだけどそれをゴリゴさんに同じの見せたら。
スピーカー 1
なんかね人生で一番わかりにくいレシピだったよあれはマジ何この人って思ったもん。
スピーカー 2
でどうしたかというとその日本語で書いてあるテキストをチャットGPTに渡してこれをなんかわかりやすくまとめてってしたらゴリゴさんでも読めるレシピになった。
スピーカー 1
つらいなりに読めるやつになった。
まあっていうので特性もあるしいろんなことがあって何が答えっていうわけではないんだけど距離感を間違えないように使っていきたいですね。
視覚と理解の違い
スピーカー 1
そのAIみたいなもの簡単になんていうのお絵かきも一緒かだからあのAIお絵かきも指示出さないとさもうみんなと同じ絵しか出てこないっていうあのこれ生成AIねって瞬間でわかってしまう絵しか書けないし
文章も多分瞬間でわかってしまう文章になってしまうので 適切な指示が出せることがやはり重要なんだよね
つまりやっぱあの書く練習をしましょうってことだよな ということであの
アトミックシンキングワークシート良かったら 詳しくはあのリンクとか貼っておくので見てみてください
29:46

コメント