00:01
前回に続いて、Googleキープを使って録音中です。
はい、ということで前回のやつ、実際に配信してみて、自分で聴いてみたところ、
ちょっと音声がダメだね。あれはさすがに厳しいかなーって言う。ただ文字の方は今もそうだけど、どんどん勝手に打たれていってるので
うーん、っていう感じだよね。複数のデバイスを使うんであれば、別に今回みたいな音声とテキスト両方を取得するっていうのは、いくらでもやりようはあるんだけど、
ただ2つの端末を使うってなると、ちょっと意味合いが変わってくるというか、そこまで力を入れてやるつもりもないし、
単純に2つのデバイスを使うっていう意味合いで、例えば、音声の録音に関しては、ボイスメモ。個人的にiPhoneでやってた限りは、
デフォルトのボイスメモっていうのを使うのが、音もはっきり大きく入るし、綺麗な気がするんだけど、
ボイスメモを録音しつつ、もう1台例えばスマホを持って、それこそGoogleドキュメントでもいいし、Googleキープでもいいし、
音声認識をさせて、そっちでテキストのデータを取得する。
対象はパソコンでテキストを文字起こししたっていいかもしれないけど、パソコンのGoogleドキュメントでも文字起こしはできるので、
それをやればいいって話ではあるけど、そうなるとね、本当にふと思ってた時に即やるってわけにはいかなくなってしまうので、
そうなるともう完全に考えてるとことは変わってくるというか、本末転倒な部分が出てきてしまうので、
そこを考えると、音質を犠牲にしてっていうところの方がいいのかなとは言っても結構音悪いよね。
この音聞いてもらえばわかると思うんだけど、特別音質にこだわるとかそんなことは全然なくて、
普段もうiPhoneで普通に話してるだけなので、それにしてもなんかスカスカな感じ。
スカスカでちょっとこもって響いてみたいな、ツイートの方でしたけどね、
フュージョンの軽いフュージョン、ドラゴンボールのフュージョンの声かぶってエコーみたいになるような、
あれの、ちょっとまた途中で勝手に途切れてしまいました。触ったりも何もしてないと思うんだけど。
ということで、今1回文章の方、勝手に文字起こしされていたものを整形してみました。
どのぐらいかかったかな。そんな大した分量ではなかった気がするけど、
それでも少なくとも5分はかかってるよね。もちろん適度なところでやめたけど、
交互のまんまで後々見返してみると文章の接続的に意味わかんなかったりとか、
同じ文末の語尾のところ、同じ言葉もひたすら続いたりとか、文章で見ると特に変には見えてしまうんだけど、
03:03
ただこの録音というか音声データを耳にしながら目で覆う人もいるかもしれないなっていうところで考えると、
あんまりガッツリ書き方変えてしまうとまた意味合いも変わってきてしまうので、
どっちがいいのかだけど、本当に音声認識させた文章っていう風に、文章は文章で見てもらうっていう使い方であれば、
ガッツリでも書いてしまった方がいいと思うし、
このポッドキャストの配信、これの説明文で目で覆いながら見て聞いてもらうのであれば、
あんまり文脈は変えない方がいいかなっていうのもあるので、ここは用途次第だよね。
なので、普通にテキストベースのブログに書く用の音声入力のついでに、
音声データも手に入れてポッドキャストも配信しようっていう2つを切り分ける形であれば、
文章はきちんと整形した方がいいだろうけど。
一番当初は多分それのはずだったんだよね。
テキストデータに関しては完全に普段書いているブログ用。
その時にDOSだから音声認識をしてるわけだから、だったらその音声はポッドキャストに使えるんじゃないかって。
その当時はポッドキャストやってなかったからあれなんだけど。
そういうとこだったから文章は文章で整形はきちんとすればいいんだけど。
ただやっぱり難しいのが、交互でこういう風にばーっと喋っていってしまうと、
一般的なブログの形式にはなかなかそぶはないというか、
逆に後でまとめようとした時に悩む部分が出てきてしまう。
これはもちろん、例えばYouTuberとかそういうのもそうかもしれないけど、
先に話す内容、見出しレベルから決めてとかそういうところを最低限しなきゃダメなんだろうけど、
それを今に至ってもまだやってないので。
ただこうやって文字起こしして内容がおかしかったりとか見ていくと、
自覚できるという部分もあるので。
後々、文字起こしした内容を修正、加える手間もどんどん身に染みてくるので、
何回も試しているんだけど。
ただ、今はスマホ一台でGoogleキープのおかげで音声入力とテキストを両方一遍に取得できているので、
より身近に手軽にこれができて、文字起こししたデータに触れる機会もどんどん増えていくと思うので、
でもすでに感じてはいたんだけど、
本当に誤字脱字直したり整形するというのは結構な手間なので、
そこを考えると先に見出しレベルのところぐらいは決めて、それに沿う形で話していったら、
目で見る方のブログ、そこを特にやるときには、
あんまり修正とか整形する箇所はだいぶ減らせるんじゃないかなと思うので。
ただ、難しいのが途中で触れたみたいに、思い出したときにふとやるっていうのとか、
06:05
あとは気持ち込みな感じ、その時の感情も含めて、
もちろん話す内容にはよるんだけど、
あんまり見出し決めてやるってなると、それも意味違ってきてしまう気がするし、
ちゃんと方向性を決めなかったところではあるんだろうけど、
全てにおいてだけど、時間の無駄だったりとか、
いろんなことがあるから、この音声入力ポッドキャストで無駄なところを減らしていく。
合わせて文章の方も手に入れてっていう。
さっきの話は逆転になるけど、ポッドキャスト初めてからの話は特にそうなので。
考えるとね。
何回も途切れるね、これ。
5分割くらい勝手にされてるんだけど、一遍に喋るつもりが。
ちょっと厄介だな、これ。
そこで一回意識途切れてしまうのと、どこまで話したっけっていうところで文章をもう一回確認をしてるんだけど、
そこでちょっと軽くこの5時とか脱時、分割した状態でやった方が一遍にやるよりも楽かなと思って今やってました。
でもちょっとこれあえてというか、タバコ吸いたかったんで、
ベランダというかそこで吸いながら音声試しに録音してます。
だからボリュームもちっちゃいし、声スカスカだったりこもったり感じになるところに対して、
この雨だとかその程度の音で影響をどのくらい出るのか、
そこを含めて試してます、せっかくなので。
間を空けると止まってしまうっていうのがあるのかな、もしかしたら。
このGoogleキープに関しては。
例えば、Googleドキュメントの文字起こしに関しては、
スマホじゃなくてパソコンの方の話だけど、間を空けててもずっと待っててくれるんだよね。
キーボードで考えると、エンターを加えたり丸とか点も、
手でのタイピングを入れつつ音声入力も同時にできるんで、
そこに関してはすごいGoogleドキュメントで考えるといいなと思っていて、
要はこのGoogleアシスタントの方になると、
Siriとは違って言葉で丸とか点とか開業って言っても、
そこは動作してくれないので、今も文字としてテキストに残ってしまってると思うんだけど、
そこに対してGoogleドキュメントの場合はキーボードを併用することによって、
その待っててくれてる間に会議を加えたり、句点等点を入れられるので、
録音は同時にってのは無理だから、
音声認識の音声入力の話になってしまうんだけど、
ということで試しに今、雨。
はい。また勝手に途切れたんで、これ6回目か7回目か。
もういいわ。5時経つうちにそのままにしておこう。
とにかくいろいろ試してきた感じだと、音声認識に関しては、
Googleがダメだなって思ってて、
Siriに慣れてるからっていうところかもしれないけど、
09:02
間違うところっていうのはやっぱりパターン化されていて、
例えば5時って言ってんのに、時間の5時になってしまうとか、Googleの方。
それ今回5時って言葉いっぱい使ってるから、もう嫌になってきた。
勝手に入力して5時って数字になって。
もうバカなのかなと。
だからSiriの方に関してもそういう点はあるんだと思うんだけど、
Siriを使ってる期間の方が長いから、
だからどこが間違うかっていうのは把握してるからなのかな。
いや、そんなことない気がするんだよな。
Siriの方が優秀な気がするんだよね、この変換に関して。
世間的にはどっちかっていうとGoogleの方がまともというか、
そういう話になってるんだけど、
個人的には全然そんなところ思わないかな。
とにかくイライラする。もう嫌になってきた。
と言っても冒頭から触れてるように、
Googleドキュメントで、Googleドキュメントじゃない、
このキープを使うことによって、
文字入力と録音と音声データと両方手に入るから、
これが一番今のところ楽ではあるんだけど、
だからApple側がSiriを使ってそういうものを用意してくれたら最高なんだけどね。
ということでまた勝手に分割されたらもう嫌になるので、
ここでやめておきます。
ということで今回は本来音質に関してというところを触れたかったんだけど、
結果的にこんな感じで話をしました。
ちょっとまだ思うところがあるので、
ブログ側にこの文章を整形ちゃんとして載せようかなっていうのと、
もう一点は、今まで試してきた音声入力と文字起こしとかそのあたり、
この2つを同時にやるっていうところの話を整理した上で、
もう一個Podcast配信しようかなと思います。
ということでまた配信するんでよかったら聞いてください。
さよなら。