00:00
こんにちは、ゴリゴキャストです。今日は、ポッドキャストを下書きにしてブログっていうのがちょっといい感じになってきたので、そういう話をします。
ポッドキャストを下書きにする。
まあ、今まで何回か喋ってきたと思うんだけど、音声認識とかがめっちゃ優秀になったから、
ポッドキャストで喋った音声ファイルっていうのを音声認識してテキスト化してやると、文章をブログとかに書くのもめっちゃ簡単だよっていう感じのことを言っていて、
何回か、ポッドキャストで喋ったのをほぼそのままテキストにしてブログで更新するっていう技をやってみたんだけど、
あれはあれで意外と読みやすいわけでもなく、
全部が吹き出しタイプになって、ゴリゴが喋ってるパート、はるなが喋ってるパートで、吹き出しで進んでいくタイプのやつ。
あれも悪くはないんだけど、なんかもうちょっとこういろいろ考えていたら、結局コンテンツとして、下地としてポッドキャストで喋った内容があって、
時折吹き出しなどを交えながらブログにささっとまとめると、書きたいことリストっていうか下書き的なものがポッドキャストで大体出来上がっているので、
割と素早く簡単に書けていい感じだった。
まあ半分がポッドキャストのおかげで、半分がハッピーハッキングキーボードがなんかすごい良い感じで書いていて楽しくてっていうのもあったりとか、
iPadで書く場合にね、吹き出しを全部やるって言うとね、またこれいろいろ厄介な仕組みがいっぱいあるので、結局テキストベースの方が書きやすいみたいなこともあったりもするんだけど。
たとえば最近ゴリゴキャストにアップした記事で、そのポッドキャストが下書きになってるやつって。
全部じゃないかな。1月に公開したやつとか多分。
あー、えっとね、ハッピーハッキングキーボード3回ぐらい書いていて、なんか一部はどっちかっていうと下書きを書いて、下書きっていうか書こうと思って漏れたから別でまとめようみたいなことはあったりしたんだけど、
なんかね、カープレイのこととかも書いたら想像以上にたくさんの人に見てもらえたんだけど、それとかも元ネタはポッドキャストで、そこに書いてあることをまとめていたら、
その頃は今よりもハッピーハッキングキーボードが俺の中で盛り上がっていたので、やる気満々でいっぱい書いてしまったら長い文章になったっていうものではあるんだけど、元ネタはポッドキャストだった。
ポッドキャストの音声を今もVrewを使ってテキスト化してる。
めっちゃ楽でね、VrewのURL、ブラウザでVrewを開いて読み込んでダウンロードするまで、2、3分かかるかな。
03:06
その認識するまでに1分、2分かかるから他のことをやっておいてテキストファイルをダウンロードすると、Ulyssesってテキストファイルそのまま取り込めるんだよね。
で、Ulyssesにドラッグドロップしてやると、大体のテキストが書かれている。
で、第2のエディタ機能みたいなやつで2つウィンドウを並べてあげると、書いているやつとそのポッドキャストの音声が元になった下書きっていうのがあって、それを見ながらこうざっとまとめるっていう感じなのかな。
それはパソコンを使って、iPadじゃなくてパソコンでやってるってこと?
今のところパソコンでしかやってないね。昼間にやる場合はほぼパソコンの前にいるから、どっかに出てたりとかっていう場合ならiPadでやるかもだけど、その場合でもUlyssesで2つ開いてシステムでやるかな。
確かに、しゃべるのって書くよりもかなり早いスピードで文字数的には話せるし、話した内容をそのまま文章として使うのはちょっと無理があるけど、下書きっていうかそれを見ながら書くとか、一部コピペで持ってくるとか、そういうレベルでの使い方ならすごい便利そう。
そのね、しゃべったやつをそのままブログにするっていう時に難点だったのが、音声認識で意味はわかるんだけど、表記が、例えばそのiPadっていうのが全部小文字になっているとか、春名っていう名前が上手に変換されていないとか、区当店の場所がうんぬんとかっていうので、エネルギーはいらないんだけど手間暇手数は結構いるんだよね。
で、それだったらもう読めるやつをそのままもう1回書き直すっていうとなんかめんどくさそうな感じがするんだけど、ザザッと見ながら書いてしまった方が早かった。
早い?違うかな。早いかどうかはわかんないけど、自分の好みに合っていた。やっぱり細かいの直すのとかはできるんだけど全然楽しくなくて嫌で、あまりいつまでもずっと続けてやりたいものではないなっていうのを思い知った感じ。
確かにその気持ちはすごくわかって、今YouTubeに字幕をオンっていう設定をすると、YouTubeがアップロードした動画に対して自動で音声認識して字幕を作成してくれるんだけど、まあまあその固有名詞、特にiPadとかは英語になってるけどそのpが小文字のままとかなんかいろいろあって、
06:00
全部コマゴマとこう直していく。で、それとかこれとかえーとかあーとかもう結構YouTubeでやる場合は入っちゃうから、そこを取り除いて読みやすい字幕にするっていう作業をちまちまやってるけど、まあめんどくさいねあれは。
エネルギーはいらないけど、こうめんどくさいよね。まあ楽しくないって感じかな。そうそう。そのなんかね、あまりにも事務作業な感じでね、こうクリエイティブじゃないという言い方をすればいいんか。で、早いかもしれないけどつまらんことは続けられんな。それだったら書いたほうがいいなっていう流れになって今に至っている感じ。
音声でしゃべった内容を文字認識させてテキストデータ化します。で、そのテキストを横に並べて新規でゼロからブログを書く。
ある意味で音声入力でブログを書いたものを直すっていう感覚に近いところもある。その音声認識で書いたテキストも、やっぱ全部がきちんと読めるものにはならないから、直さないといけない。で、場合によってはそれだったらもう最初から書いたほうが早いやとか、コピペしてうまく使える場合もあるかもとか。
なんか感覚的には音声認識のタイムラグの大きい音声認識下書きブログという言い方もできるのかもしれない。テキストからその使えるところはコピペしたりもするの。
うーんとね、しゃべって思ったけどね、多分やってない。 打つの早いしね、打つのが楽しいっていうのもあれば余計かな。 別にね、俺タイピングはね、ちなみにね、楽しいわけじゃないんだよ。うまく言えないんだけど。これは多分あの多くの異論があることだと思うんだけど。
キーボードの押し心地とかそういうことをめっちゃ言うくせに、タイピングという行為が楽しいかって言われたら別にそうではなくって、なんかそういうものではないんだよね、不思議なことに。じゃあ嫌いなのかって言われたらそれもわからんくって、いろいろキーボードの押し心地云々とか言っといて自分でも不思議なんだけど、この感覚はなんて言ったらいいんだろうね。
わからないね、それは。あるなぁ、逆で、可能な限りタイピングはしたくないっていう、遅いし、間違えるし、特にそのキーボードの押し心地に快感とかも得られないし。
なんか俺が絵を描きたくない、手書きの字を書きたくないと全く同じような話になるよね。 そう、だから本当に逆で、それだったら手書きでApple Pencilでも文字書いた方がいいわっていう。
俺の場合、多分手書きで文字を書くことはありえない。音声認識で書いた文字は最終形としては全然求められるレベルに達しない。
09:06
そうすると最終形として一番早く美しく書けるのがキーボードだから選択肢としてキーボードがあるっていうイメージで、もし仮に脳内に文字を浮かべたらそれを書いてくれるんだったら俺はその方がいい。
未来的な話で可能になるかもしれないけど、人間の脳っていろんなこと考えてるからさ、結構この文字だけを打ち込むっていうのは難しいんじゃないって思うけど。
まあまあ、イメージ。一番消去法で残ったのがキーボードでタイプすることだったっていう感じかな。
その何らかの表現の手段として。っていうので、まあ言いながら確かに押し心地がいいっていうのはあるんだけど、結論がよくわかんなくなったのでこの辺にしておきましょう、そういう話は。
音声をテキスト化してそれをネタというか元にして新規で文章を書くと書きやすかったっていうお話。