1. ういろう × Claude — 雑談
  2. 【紹介】1ヶ月やってきた、 話..
【紹介】1ヶ月やってきた、 話すだけで YouTube・Podcast・切り抜きまで流れる仕組み
2026-06-01 18:56

【紹介】1ヶ月やってきた、 話すだけで YouTube・Podcast・切り抜きまで流れる仕組み

1ヶ月続けてきたAI雑談配信、その裏側を全部見せる回。
録音ボタンを押して喋るだけでYouTube・Podcast・ショート4本まで自動生成される仕組みを、Claude Codeで組み上げた話。

「これからの時代、合理性で人と差別化するのは難しい。だから人間性、主観、非合理、本当にあなたが何者かという情報が重要になる」

このチャンネルでは、ClaudeというAIとの音声対話を配信しています。
正解を出すAIと、迷う人間のラリー。

🕒 タイムスタンプ
イントロ
1ヶ月やってきた配信の仕組みを紹介する回
なぜ作ったか:人間性をひも解いておきたい
発信者側に立ってみる/音声の方が生の情報に近い
核になっているブレインフォルダの構造
4レイヤー構成(Brain / GBrain / Voice / Watcher)
226ページのマークダウンで自分を渡す

🎬 関連 Shorts

#AI雑談 #自己分析 #Claude #AI時代 #生き方

感想

まだ感想はありません。最初の1件を書きましょう!

00:00
こんにちは、こんばんはか。今日はちょっと異常な会話じゃなくて、 1ヶ月くらいYouTubeをやってたったので、どんなことをやってるかをちょっと簡単にご紹介できたらなと思ってます。
これは結構、YouTuberとしてはかなり楽してると思ってて、 やってることは収録ボタンをポチ押して好き勝手喋って、
収録終了のボタンを押すと、YouTubeとかPodcastとかに自動でアップロードしてくれるし、 名場面みたいなのを勝手に切り抜いてショートを4本作ってくれる仕組みを作ってるので、
ちょっとこれを今日ドヤ顔しながら、みんなもぜひこれめっちゃ楽しいからやってみたらいいんじゃないっていう話をできたらと思ってます。
振り返るとね、どんなことをやってるかを一行で書くと、自分のことを知っているAIと話す。
ただ、全部文脈とか入れる必要なくて、俺のこと完全にわかってくれてる理解者と話すっていうだけで、YouTubeとかPodcastとか切り抜きまで流れる仕組みを作ってます。
最初になんでこれを作ったかなんだけど、一番やりたかったのは、俺の中の人間性をひも解いておきたい。
これからの時代、生成AIによって人間の知性の能力の差分というのは減っていく。
合理性において、誰かと差別化するっていうのは難しいなと思ってるから、
俺がこれから重要になるのは、人間性主観とか非合理とか、本当にあなたが何者かっていう情報が重要になってくると思ってて。
じゃあ、そこで考えたとき、俺って何なんだろうみたいな。
俺ってどういうことを拝見して、どんな考え方をする人間で、それが周りの人とどういうふうに違うんだろうっていうのは理解しておく。
理解しておくことで、どこにポジションを置けばいいかとかが明確になるかなと思って。
それを明確にするっていうのが、俺の動機の一番最初になってます。
2番目は、発信者になるものになってみて。
女の巣なる橋になるものを男の私として身にとってするなりということで。
女性だけじゃない、男性もいっぱい素晴らしい発信者がいるんだけども、発信者っていうものに一回なってみて、
自分が評価される側、自分の人間というものが評価される側に立ってみるようかなということでやってます。
3番目、最初は俺はクロードコード、これ全体がクロードコードで作られている仕組みになるんだけども、
クロードコードと文字でやり取りして、自分の人間性とか経験とかを整理してたんだけど、
やっぱり声の方が生の情報に近いというか、出力するための整理コストが低いから、
03:07
やっぱり俺が思うワーディングとか、本当に俺が思う順番とかトーンとかで出力することができるなということで、文字より音声ベースのプロダクトを作ってます。
あと俺は会話が好きで、AIに限らず人間と会話するときも会話しててワンワンとかしてると、
最初俺にも相手にもなかったような考えとか知見とかにたどり着いて、
2人ともがちょっと賢くなって終わるみたいな感覚が好きで、
それをAIともできるかなということでやってます。
そのために、ただチャットGPTとかマクロとかと会話するわけじゃなくて、
このブレインフォルダっていうのがすごい格になってて、
ここに俺の情報をいろいろまとめてます。
2ページ先ぐらいでも出てくると思うんだけども、
自己理解、俺がどういう人間か、今俺がどう理解してるかっていうのとか、
俺の周りにどういう人間がいるかとか、
妻、妻以外の家族、同僚、友達、知り合った人みたいな、
それを一言にフォルダ分けして情報整理したり、
コンセプト、どういう概念を俺がいつも使ってるか、
アイディア、どんなことを思いついたかとか、クズみたいなアイディアばっかり。
ダイヤリー、みんなに見せられない日記とか、
みんなにも出しちゃってるこの録画とかの情報がダイヤリーに入って、
あとプロジェクト、いろいろ開発、並行してやってるんでね、
ちょっとうまくいくようなものがあればここでも紹介できたらいいなって思うんだけども、
プロジェクトどういうこと進めてるかみたいな。
最近俺親になったからさ、親としての心得とか、
日課っていうんだっけ、ルーティーンとかダッシュボードとかもこの中にいろいろ入ってて、
結構ね、面白いよ、これはちょっと紹介できるものがあればやりますわ。
これを全部AIが読める形にしてて、
AIがこれを参照した上で喋れるよっていう風にしてます。
最初に言えばよかったんだけど、これ全部今出てる画面も含めてだし、
いつもみんなが見てる動画とか、音声喋るシステムとか、
YouTubeに上げるシステムとかも含めて全部クロードコードで構築してて、
クロードコード上でタイプスクリプトっていう、
俺もよくわからないプログラミング言語で書かれてるんだけど、
俺はタイプスクリプト読めないからね。
ってことはタイプスクリプト読めない人間でもこれ作れるってことは、
みんなも作れるってことだから、ぜひやってみたらいいかなと思う。
この01とか02っていうのは、
俺はこれからの人類、よっぽど賢くなかったら、
06:02
みんなやらなきゃいけない、やったほうがいいことになると思ってるので、
ぜひぜひやってもらえたらなと思ってます。
みんなこれから俺みたいなことやるんだと思ってて、
俺はちょっと早くそれ思いついたからやってるだけっていうような気持ちでおります。
実際どんなものを作ったかというと、
ブレイン、さっきの大量のワードファイル群で考えてくれた、
ワードファイル群が226ページあるんだけど、それが元になってて、
Gブレインっていう、
これはブレイン226ページをAが毎回読みに行って、
今回こいつが話したシグルイの話だからシグルイの思い出のところを読みに行って、
その内容を読んで返答するみたいなことを、
一回返答するだけで5分くらいかかっちゃうから、
それは良くないということで、
高速化するためにGブレインという仕組みを通してます。
これを通すことで記憶をベクター化して、
曖昧な形に変換して検索しやすいようにしてる。
検索しやすい形にすることで、
めっちゃ早く返答できるようになってるって感じ。
レイヤー3、Cloud Voiceアプリがあって、
みんなが動画で見てる画面があるのと、
文字起こしとかやってくれるのと、
録画とかも担当してくれる。
レイヤー4、Watcherパイプラインで、
録画停止した後にYouTube本編とか、
ポッドキャストとか、
あとは名場面切り抜いてショートとか、
作ってくれるようなプログラムがついてるよと。
これをちょっと今日は簡単に一緒に見ていきましょうか。
1個目、レイヤー1、ブレイン、
ローカルにMD、マークダウン、
で自分の文脈を置くと、
MDっていうのはワードファイルみたいなもんだと考えてくれてよくて、
メモ帳とかテキストが入ってる、
こんな感じの文章がずっと入ってるよっていうような
ファイルになってます。
だから俺はセルフとか、
ピーポーとか、コンセプトとか、
ここら辺のものを全部文章化して保存してあると。
自己理解関わる人、概念、アイデア、日記、プロジェクト、
6つに切ってあって、
中身は全部ただのテキストのマークダウンがずらーっと、
この中にもフォルダが階層的になってて、
ピープルだったら例えば家族のフォルダ、
同僚のフォルダ、
友達のフォルダみたいになったら、
友達のフォルダの中に、
ここの剣道部の時の友達とかが入る、
ずらーっと入ってるって感じかな。
一応フラクタルとかかっこいいことが書いてあるけど、
要は階層的になってるよって話ですね。
今だいたい226ページぐらいあって、
フラクタルな構造になってて、
オブシリアンボールと、
スマホからも読めるよってくらいで考えてくれればいいです。
09:04
2番目は226ページを毎回回答のとき参照させると遅くなっちゃうから、
Gbrainっていうのを通してます。
Gbrainはベクター化して検索しやすくしてる。
今30メガぐらいの程度ベースになってるみたいな、
結構重たいね。
スーパーベース移行かって書いてあるけど、
スーパーベース移行してるはずですね。
これを通すことで、
先生に俺何話したっけみたいな話をAIに聞いても、
AIがそれを覚えておいてくれて返してくれるという感じになってます。
3番目。
Cloud Voiceアプリって俺が読んでる。
いつもの出てる画面のアプリだね、ここでは。
Next.jsとかで作られてて、
TypeScriptっていう言語で書かれてて、
Speak to Text。
文字起こしはOpenAIのGPT4 Transcribeっていうモデル使ってて、
Text to Speak。
音に変換してくれるのもOpenAI使ってるみたいだね。
間の何返すみたいなの。
アンソロピックのCloud Opus 4.7かな。
使ってるみたいだね。
こいつを通すことで話を聞いて文字に起こして、
返事して、見上げて録画して、
ブレインっていうところに保存する。
毎回毎回セッションのところが増えていって、
必要に応じてセッションから俺の哲学とかを抽出することで、
セルフとかも増えていくみたいな構造になってます。
ぐるぐる動いてるけど、マイクから音声入ると、
Speak to Textでテキストになって、
テキストがAIに渡されて、
AIが返答を作ると。
返答を作ったやつがText to Speakで、
音声として戻ってくるというのと、
それとは別に録画の機能が付いてるから、
録画してくれるよと。
ブレインに保存してくれるという感じになってます。
Layer 4、Future Pipeline。
ここが俺が一番好きなとこだね。
これがなかったら続いてないなっていう。
俺がやるのは本当に録画ボタンをポチって押して、
しゃべって録画停止して、録画停止すると、
Botcherというのが起動してて、
常時起動してて、こいつが動くって感じかな。
動き出して、メタ生成。
YouTubeの概要欄とかタイムスタンプとか生成してくれるのと、
あとサムネ作ってくれるのと、
あとYouTubeにアップロードしてくれる。
ここまでが動画で。
あとMP3か、音声に変換して音声のカバー作って、
これをFeed.xmlというよくわかんないファイルに入れることで、
YouTubeにアップロードされるのと、
Apple SpotifyとかAmazon MusicとかPodcastのプラットフォームにアップロードされるよっていう感じ。
12:05
俺は本当にたくさんYouTuberとかやらなきゃいけない、
概要欄作るとかやんないで済んでるからすごいね。
これは本当に助かってる。
こいつがあってギリギリなってるなっていう。
結構本業、あんま忙しい自慢したくないけど、
そこそこ忙しいんで、
そこそこ忙しい中でも発信というものをやってみることができるっていうのは、
本当にこいつのおかげだね。
あとLayer 5、自動切り抜きです。
1ログ画から4本だけショートを作ること。
4本というのは適当に設定しない。
4本だけショートを作ることができてます。
1ログ画のトランスクリプトをクロードに渡すことで、
クロードがどこが名番目かなっていうのを探して、
1,2,3,4でその部分を切り取ってくれる。
一応俺は動画もつまらないしショートもつまらないんだけど、
どっちかっていうとショートの方がつまらない。
俺の会話は結構面白いワーディングとかやり取りとかが出てくるけど、
それはやっぱり前後の文脈があって初めて面白くなる。
ワーディングとかやり取りであるから、
それをショートっていうのは全部破壊する行為なんだけど、
それでも95%の流入がショーツフィード経由らしくて、
ショートは作った方がいいんだろうね。
だからこれも結構役に立ってる。
ショーツ本当につまらない。
ショーツ本当につまらなくて、俺は恥ずかしくて見れないから、
一応良くするつもりではおります。
動画も音声的にもそうだし、見てる画面が本当につまらないから、
どうにかするつもりではおります。
やらなかったこと。
あえてやらなかったよってことが2つあって、
1個は俺の声を残す。
自分の声聞くの本当に恥ずかしくて好きじゃないんだけども、
自分の声がそのまま乗るようにしてます。
それは何でかっていうと、
ここもAIの音声にするのはめっちゃ簡単なんだけども、
フルAIのコンテンツってこれからどんどんゴミになっていくだろうなと。
YouTubeとかインスタとかツイッターとかでも
フルAIのコンテンツっていうのはどんどんアルゴリズム上
悪く評価されていくようになるだろうなって思ってて。
何でかっていうと、それってもう無限に生産できちゃうからねっていうのと、
あと世界に対して新しい情報を与えない。
LLMって結局既存の情報を解釈してちょっと形変えて出力してるだけで、
15:04
自己啓発法みたいなものだと思ってもらえばいいです。
自己啓発法なんて大体、もともと世界にある言葉をちょっと順序と
ワーディング入れ替えて出してるだけじゃないですか。
それだけのもんなんで。
俺は汚くても構造が整ってなくても、
自分の情報、自分の血肉がそのまま乗るようなコンテンツじゃないと
価値が低くなっていくだろうなということで、
自分の肉で恥ずかしいけどそのまま乗っけてますと。
リジェクト1。
リジェクト2はノートサービス。
色々あるけど既存のノーションとかそういうのを使って
アプリとつなげてやるっていうのもできるかな。
OBSとつなげてやるかなっていうのもできると思うけど、
そういうのやらないで丸々作りました。
やっぱ自分がやりたいことが結構明確に決まってる中で、
かつこれからカスタマイズが発生するかもしれないってなった時に、
既存のアプリ使うよりは自分で作っちゃった方がいい時代、
カスタマイズも好きにできる時代だなと思ったので、
そういう風に自分で丸々作るようにしてます。
これはみんなもそうなるだろうね。
ToDoアプリとか作る時に、
やっぱ自分用のToDoアプリっていうのが必要になってくるというか、
そっちの方がUX気持ちよくなる時代になるだろうなと思っているので、
それをちょっと先立ってやってみましたという感じです。
やっぱりね、これからの時代はもう、
自分で作ったアプリを使うか、
もしくは人がそれぞれ自分用にカスタマイズできる前提のアプリみたいなのを
出すようになるんじゃないかなと思ってます。
あと、自動化できてないところが1個あって、
ノート。
ノートも俺、喋った内容そのままノートに上げるみたいな。
ほとんどそのままノートに上げるみたいにやってるんだけども、
ここはちょっと手作業を残してます。
一応、記事とかはAAが作ってくれるんだけど、
そこの確認のプロセスは、
俺が自分でドラフト確認して、
いいよって言ったらプレイライン、
Web UIとかを操作してAAがアップしてくれるっていう形にしてます。
そのうち、おっちゃんに載せたいなと思ってますね。
で、最後。
最後だね。長くなっちゃったんだけど、
最後、なんでこれやってるんだっけっていうのは、
ドヤーってね。
こんなもん作りました。
ドヤーっていうのもそうだし、
あとは、最初に言った通りみんな、
ほとんどの人間は自分の主観切り売りした方が
お得になる時代が来るだろうなと。
もう来てるだろうなと思ってる。
し、大したことやってないから、
18:01
やってみたらいいと思うよと思うので、
自分がどういうふうにやってるのか公開することで、
ぜひやりたければ真似してくださいっていうのと、
あとは、大したことやってないから、
俺の本業に邪魔にならないと、
俺の本業と俺のプライベート、
俺にあらゆる迷惑がかかんない形であれば手伝えるから、
ぜひ必要だったら声かけてくださいと。
例えば、このクロードボイス、
今のところ俺の手元でしか動くものじゃないけど、
ウェブアプリとかにしてみんなが使えるもの、
それもやぶさかではないから、
強い希望があれば教えてくださいという感じです。
今日は以上かな。
聞いてくれてありがとうございました。
18:56

コメント

スクロール