ツール作りの挑戦
おはようございます、詩吟YouTuberのheyheyです。
今日はAIのツール作りの話になるんですけれども、今1番このツールが欲しいっていうのは見つかったんでですね、それを話すとともに、
これちょっとチャレンジしたんですが、結構不可能っぽいんですよね。
本当になんか全然できる感じが湧かないので、本当にアイディア求むみたいな感じにはなっております。
これ何をやりたいかというと、音声配信、過去の音声配信からデータを抜き出して、それを知識としてですね、自分の学んできた知識としてデータベースにストックしたいんですよ。
具体的には僕の場合、ボイシーとスタエフ、あとはポッドキャストですね。
この3つのところから、普段から毎日結構聞いているんでですね、そこからデータを抜き出して、音声データから文字に書き起こしして、かつ使えるデータとして文字データとしてストックしていくと。
それもちゃんといろんなタグ付けとか属性付けとかされていて、引き出し可能な検索しやすくて、結合もしやすいような、そんな形にまとめていくというものです。
どうですかね、これ伝わりますかね。
確か前に、つい最近にオブシディアンってやつとカーソルか、それを組み合わせると、いろんなメモがただのメモとして埋もれていくのではなく、この知識の集積として残っていって、それからさらに組み合わせることによって自分の血肉になっていくみたいな、そういうシステムがあるんですよ。
ただこれ本当に難しそうですね。ちょっとまだ全然着手できていないんですが、それからもちょっとヒントをもらってですね。
別に僕普段そこまで文章を読む時間が持てていないんですよね。代わりに何でインプットできているのかというと音声配信なんですよ。
ボイシーとスタイフがやっぱり今までずっと聞いてきたからですね、普段今まさに聞いているものに関してはリアルタイムでそこからデータを取りに行ってほしいし、もしくはリアルタイムじゃなくてもですね、過去の視聴履歴から遡ってパソコンがこっそりカタカタ動いてですね、
そこから音声データから書き起こしデータを抽出してそれをどんどん保存していくみたいな、そんなやつ作りたいんですよ。誰か作ってくれないですかね。
技術的な壁
これが本当に今まで自分が学んだことを復習することもできるし、そこから何ができるかみたいなのも出せたら、音声配信聞いてきた意味があるなというか、知識としてストックされてきた感じがあるなって思ったんですよ。
作りたいなーってやってみたんですよ。やってみたんですけれども出だしでめちゃくちゃにつまずきましたね。
これはパソコンデスクトップ版と言いますか、パソコンの方から視聴履歴のデータが見れないんですよね。これがめちゃくちゃ致命的で。
僕は最初パソコンの方からログインしてですね、視聴履歴から。そこからURLとかをですね、ガーッとスクレーピングして、そこにアクセスして音声データから書き起こしするみたいな、そんな感じでいけるんじゃなかろうかなと思ったんですけれども、スターFもボイシーも両方完全に閉ざされていてですね、アプリのスマホの方からでしか見れないという形だったんですよ。
どうも何度もパワハラプロンプと投げてもですね、なかなか手段が見つからなくて、今もしやるとしたら手動で一個一個URLを多分出していってやることになるのかなと思うんですよね。
一方でですね、一方でポッドキャストについてはいけそうなんですよ。やっぱりポッドキャストがオープンになっているからというのもあるのと、視聴履歴というかですね、今リアルタイムで聞いているやつとかはSNIPDっていうのかな、SNIPDっていうアプリがあってですね、それで再生したやつをNotionに連携して書き起こし文章をまとめたやつを飛ばすことができるみたいなんですよ。
とりあえずインストールして適当に数分再生させたら、それから後で書き起こしたやつを連携してくれるらしいです。今のところまだ書き起こされた結果見えてないんですけれども、これもポッドキャストの場合はいけるなと。
むしろポッドキャストを再生するときに、このSNIPDってやつからポッドキャストを検索して再生すればいい感じにいけるのかなと。ただ過去のやつはですね、基本やっぱポッドキャストは最近聞き始めたんで、このボイシード、スタイフ、視聴履歴から何とか出して、今まで聞いてきたものからどんな知識がどれだけあるのかをですね、文章として残して検索できるような形に。
なんかやりたいんですよね。理想は言えば、さらに理想を言えばですね、ボイシーの各配信の中のコメント欄のデータも抽出したいんですよ。
特に木下ひとしさんの配信、僕しょっちゅう聞いていて、ちゃんとコメントも毎日返してるんですけど、そこのコメントもめちゃくちゃ有益なんですよね。
最近だと、この各地方に散らばっている伝統光源品とか、藩主に対する健常品として、それがハイコンテキストなものだから、今後そういうものが価値を持ってくるんじゃないかと。
全国各地の中にそういう情報があったら教えてくださいと木下さんが言ったらですね、本当にいろんなコアの情報が集まってきていたんですよ。
そういう情報とかもせっかくだからですね、サクッと見えるようにストックできるような形にしたいなと思ったんですけれども、本当にクローズドな感じで抽出できないんですよ。
なんとかできないですかね。本当にアイデアを求めているというところでした。
思った以上に悔しかったんで、今日はこの悔しい感情がめちゃくちゃ乗った配信になっておりますけれども、誰か助けていただければ幸いです。
では最後まで聞いてくださってありがとうございました。バイバイ。