1. 詩吟日本一による「声を鍛えるラジオ」
  2. 次にバイブコーディングでやろ..
2025-07-22 06:28

次にバイブコーディングでやろうとしていること


---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/5f18a737907968e29d7a6b68

サマリー

彼はバイブコーディングを通じて、AIを活用した効率的かつ自動化されたライティングを目指しています。具体的には、音声データをもとにノートやブログの記事を作成し、さらにサムネイル画像の生成も連携させる計画です。

バイブコーディングの目指す方向
おはようございます。詩吟YouTuberのheyheyです。本日2本目の配信になるんですけれども、これから次にバイブコーディングでやりたいことという話でいきたいと思います。
まあ本当にこれはちょっと頭の整理の形にはなるんですけれども、先ほどの配信でようやくホームページができましたというところで基盤ができたと。
次に今やろうとしているのはですね、バイブライティングになります。AIを使ったより効率的、自動的なライティングですね。主にはブログ用とかノート用の記事の投稿というところになります。
ただ、昔ちょっと前の場合はですね、音声の書き起こしをクラウドに投げて
で、この自分のフォーマットに合わせた感じでプロンプトを作り込んでですね、それでやってもらって最後微調整して投稿という形で作っておりました。
ただ、その作業自体もですね、言うて10分くらいはかかってしまうので、その10分が惜しくてですね、今ノートなかなかやっていなかったんですけれども、半年くらいかな。
半年くらいノートちょっとサボっていたんですけれども、今ようやく落ち着いたんでですね、そのあたりも再開しようというところです。
その時よりもよりもっと効率的かつストックがされていくようなものにしようと思っているんですよね。
具体的にやっていることとしては、まずはフォルダ整理をしています。
このWindsurfでですね、やっているわけなんですけれども、そのあたりはですね、どうも無理やり適当にやっているとどんどんフォルダがぐちゃぐちゃになっていくんで、
このライティングという、クラウドというフォルダの中にライティングというのを入れて、その中でノート用なのかとかエクスポスト用なのかとかですね、
ブログ用とかそんなフォルダを作って、あとドラフトとダウンとリメイクというフォルダを作って、それでまず音声データを入れたら、それを書き起こし。
音声から文章への自動化
音声データの書き起こしをまず入れて、それを自分の文体に沿って1回作ってもらうという流れですね。
さらにはそこから自分が微調整、最初のうちは微調整するんですけれども、この微調整済みのやつをリメイクフォルダに入れてですね、リメイクしたものと最初にAIが出力したものの差分を学習してもらって、
それをさらに自分の文体用のルール、文体ファイルに更新してもらうと。 だからだんだんと修正点を減らせるような工夫を今しているところです。
これはライティングシンプルに、今まではクラウドでやっていたのをクラウドコードでやってもらっているというだけなんですよね。
もう少しここからさらに踏み込みたいなとは思っています。毎回プランプトを打つ必要がないというのはとても楽なんですけれども、
音声データを入れたら、そこが勝手に書き起こししてもらって、その書き起こしからノートの記事にノート用のやつを作ってもらうと。
さらにはそこからサムネ画像もグレードアップしたいなと思っているから、そこも全部連携できたらいいかなと思っています。
サムネ画像もChatGPT単体で作ろうと思っていたんですが、あまりこれちょっと微妙だなって思ったんですね。
というのも、ちょっと前までこのAIの動画作成をクライアントワークでやっていたんですが、その時に気づいたこととして、自分の作りたい画像をやる場合に、
まずChatGPTの4.0の方でイメージエフェクス用のプロンプトを作ってもらって、それをイメージエフェクスにコピペしてやると、そっちのが一回に4枚できるしクオリティも高いしというので、それが一番要望に沿った画像が出やすい効率的というところなんですね。
だからこのあたりの流れをもう少しうまいことできないかなと思っています。
4.0でやるところがポイントなんですよね。O3でやるとどうもうまくいかなくて、4.0でプロンプトを作って、それをイメージエフェクスにやると。
そこらへんどこまで自動化できるかというところではあるんですが、せっかくバイブコーディングやってるんでですね、
音声を原液として、そこからノート用の文章、あとはXの長文ポスト用、さらに自分のブログ用と、
あとはメルマガ用も作ればいいのか、だいたいそこらへんを一気にできるような仕組みを作りたいなと思っています。
まだここらへんも下地をコツコツ作る段階ではあるんですけれども、これがより簡単にできるようになると、本当に自分が頑張るのはこの喋るところだけという感じですよね。
喋るとこうやって音声をポイって入れたら、だいたいもう4つ、3,4パターンの文章がドラッとできていて、それもあまり修正する必要がない。
できればどんどん自動で学習していくような形にしていけば一番いいんでしょうけれども、そこの簡略化、一度こういうものを作ってしまえばだいぶ非常に便利だと思うので、
そこですね、そこですね。で、画像生成をどこまで一緒にセットでできるかというところを頑張っていきたいと思っております。
ちょっと今あまりうまく喋れていませんが、お付き合いいただきましてありがとうございました。バイバイ!
06:28

コメント

スクロール