こんにちは、声に偏る世界線。今回は、AIで作ったポッドキャスト用のツール、こちらについて触れようと思います。Google AI Studioで作った自作ツールになります。
前にも触れたことあると思うけど、今回ね、よりちょっと、うんと、もう具体的に使えるんじゃないかなみたいなもの。はい、作りました。
で、これ作った後に、今、頭にこの文章じゃない、あの音声追加してるんだけど、6月のね、26日に一旦作ってツイートしたりしたんだけど、あのスクショとかもそれ載せてあるので、概要欄から飛んでもらえると。
で、ただね、なんかね、その、この後に今音声流すんだけど、その当時の26日の時の、作ったばっかの時、ツイートの直後とかその最中に録音したくらいかな。
はい、なんだけど、その時に実装無理かなと思っていたものもできて、なんかね、より今は便利になっています。
音声、何個もの音声を録音して分割したものを配置して、並び替えとかできるようにしたんだけど、なんかね、その各音声クリップの中の分割とかトリミングができないかなと思ったんだけど、そんなことありませんでした。
なので、現時点はそこらへんも対応しているので、はい、この辺りも随時スレッドにくっつける感じで、こんな感じにできたとかってツイートしたいので、併せてチェックしてもらえたらと思います。
はい、ということで、当時作ったタイミングで、まあ記録として残しておこうと思った内容、この後話しているので、そちらチェックしてみてください。
今回はGoogle AI Studioでポッドキャスト向けのツールをまた再び作っているという話で、はい、これがなかなかいい感じなので、ちょっと記録として残しておきたいと思います。
結構ね、作れるね。ツイートとかで触れたのだと、旧Anchor、Spotify for Creatorsの前身にあたる旧Anchorの時の
音声の編集というか、エピソードの構成を決定するような、そういう感じにちょっと近い感じで作れました。
どういうことかというと、音声ファイル、例えば4種類の音声ファイル、例えばタイトルと本編2つに分割したものとエンディングみたいに音声があったとして、
その間にSEとかを挟み込んだりとか、ドラッグ&ドロップで並び替えたりとか、そういうことができました。
これも何回も触れているけど、謎に収益化機能が使えるようになった時期があって、日本は大障害となっているから、使えたとしてもお金がもらえないというのは分かった上で、でも機能を試してみたいということで、広告を挟む機能とかも実際に使ったりしていました。
このドラッグして、例えば6個のブロックがあったとして、音声4つの、いすい1個と音声広告みたいな感じだったとしたら、これをどう配置するかみたいなのを自分で決められるんだよね。
それこそ例えばYouTubeとかだと、収益化している人だったら分かると思うけど、広告をどこに入れるか。
最近は手動じゃなくて自動で広告を入れるっていうところが何か使用変更になって、より収益が上がりやすい形とかってそういう話になっているのかね。
YouTube側が言っている話だかどうかは分からないけど。
今マニュアルでやってた頃って、続きが見たいと思う瞬間にあえて入れるみたいな手法とかってあったりすると思います。
それが裏面に出るケースもあると思うけど。
例えばドッキリで3、2、1でそのドッキリの瞬間みたいな状態でそこでCMを挟むとか。
結構嫌な感じだけどね。
要はそういう感じのこともアンカーとかだとできました。
音声側を分割しなきゃいけないからそのタイミングに合わせてっていう手間とかあったりはするけど。
そこまでの音声の分割とかまでできないんだけどトリミングとか。
できないけどその並び順を変えたりってとこまではできるようにしたので。
なかなか悪くないんじゃないかなっていう感じです。
あとはびっくりしたことにね、ノイキャンとかコンプレッサーとかあとはノイズゲートとかそこらへんの機能も付けられました。
さらにはラウドネスノーマライゼーション。
この辺りも機能として付けられて。
なんか前にやろうとした時にうまくいかなかったんだけどなんかスルーされたのかな。
本格的にやらないとできませんみたいなこと言われたような記憶があったんだけど。
今回やったら普通にできました。
ちゃんと機能もかかっています。
なんかそのうまくかからないとかそういうところは抜きとしてとりあえず効果自体得られます。
単純にエキスパンダーとか分かりやすいと思うけど。
エキスパンダーノイズゲート2つ分かれたかな。
要は余計な環境をカットするとかっていうのはこの敷地に値するところ。
そのスライダーにしてあるんだけど。
それをいじればその音量未満のものは全部カットするとかそんなのもちゃんと反映していました。
あとは当然BGMを裏で流すとかそういうのも入れたし。
あとはこれはポッドキャストならだでどうせだったらこうしたいって思うもの。
ちょっと話前後してしまうけど。
自分で音声収録する時っていうのもそうだけど。
最近ってAIのボイスクローンで音を読み上げさせて細々と分割した音声ファイルをオーディション上で並べ替えてみたいなことをしたりしています。
そこに自分でリアルにしゃべる声も混ぜたりとかいろんなやり方をしてるんだけど。
それをやるとね結局当たり前なんだけど並べてってなおかつBGMを設置して。
あとはなんか場面の切り替えだったDJのスクラッチみたいなのを入れてとかそんなことするわけだよね。
まあそれは当たり前なんだけど。
これ自体が手間だなってのもあるし。
これここに時間かける意味ぶっちゃけないなっていうところがものすごく大きくて。
やってて楽しいとかもあるから別にそういう点では構わないんだけど。
ぶっちゃけ全然再生されるわけでもないしそこでそんなところに時間を使うのも馬鹿馬鹿しい。
っていうのも含めてあとは全く別のベクトルでAI自体に興味が湧いている最中なので。
じゃあそっちを優先的に効率化する方に頭を持っていこうっていうところを今回試しました。
これをやるだけでDNA割り切りもできるし
なおかつその並べ替えだってドラッグ&ドロップで完結するわけだし
BGMだってアップロードするって形を取ってるんだけどアップロードするだけだし。
でねもう一個Adobe Auditionとか使っててだるいのが
例えばさBGMの最初のイントロ数秒間はボリュームを大きくしておいて徐々に下がっていってみたいなことってやったりするじゃん。
あと終わりの時もさ逆に最後。
例えば個人的にはさよならって言ったら終わるのが多いんだけど
さよならって言ったときは急にガッと持ち上がって最後フェードアウトみたいな感じの
最近ちょっと入れたりしてましたマニュアルで。
そうでねなんかそれがね地味にちょっとだるいんだよね結構めんどくさい。
特に終わりの位置をさこのタイムラインに置いてあるクリップ音声クリップを合わせてBGMのやつを合わせて
で最後ボリュームが上がるところをペンツールみたいので打ってみたいなそんな感じのことをするわけだけど
これがね地味にだるい。
ちょっと長ささ音声側をもし変えたとしたらここやっぱ邪魔だなと思ってカットしたりとかして
そうすると今度BGMの後ろの位置合わせなきゃいけないわけじゃんドラッグして
でドラッグしたらそのボリュームその上がるタイミングとかもずれちゃったりとかいろんなことあって
とにかく全体的に手間で。
でなおかついちいちさ一回そのオーディションで編集とか始めちゃうと音質について気にし始めちゃうじゃない少なからず
例えばフィラーがどうこうとかもそうだし音質自体も
ちょっとこれ環境音いっぱい張りすぎだなってもっと気を付けなきゃとか思いながら
一応テンプレートとしてある
トラックに対してかけるエフェクト群っていうのは作ってあるわけよ
これとこれとこれとこれをかけるっていうもう決めたテンプレ化したものが並んでるんだけど
ここから微調整とか始めちゃったりして
もうそんなことやったって大差ないのに大差ないっていうのは実際差はあるんだけど
そんなとここだわったってささっき言ったみたいにさそんな再生されるわけでもないのにっていう話じゃん
なので今回のはさっきの並び替えができるとかBGMも入れられてるのと
プラスBGMに関してもね指示出したら簡単に全部作ってくれるんだけど
その冒頭の何秒間はボリュームでかくしておいて
そこからぐっと下がってみたいなそういうのもできるようにしました
デフォで数値は全部こっちから指示して決めておいて
できることがイントロの最初ボリューム何デシブル上げとくか
何秒後に下がるかみたいのがまずできます
終わりに関しても喋り終わった最後ボイス音声側が終了した時点から
ぐいっと音量上がって何秒間継続してから終了するみたいなのもできるようにしました
なおかつ音声ファイル音声がイントロBGMに対して音声が開始するタイミングの遅延
頭に何秒間を取るかっていうのもこれも設定できるようにしました
デフォでこれこのぐらいでいいかなと思うのは当然指定してあるんだけど
全部スライダーでいじれるようにしてあります
これだけ考えてもね結構いい
ここだけ考えてもいいわめっちゃ楽だわ
AIで楽にできるものはどんどんしていきたいなっていうのプラス
本当にこれどっちにするかなんだけど楽しむっていうところも含めて
Adobe AuditionとかPremiere Proを触ってっていうのが楽しさの部分も少なからずあるので
それはもう完全に作業として捉えてなければないでいいものっていう方向に持ってかないと
個人的に今の状況においては無駄しかないかなっていう
今の形でいいんじゃないかなと思いつつやってる最中な感じではあります
ここからって機能を盛り込んでいったらいくらでもつけていけちゃうんだけど
1個肝になるものとしては現時点では音声ファイルをアップロードするっていう形をとっています
音声にあたる本当に声の喋ってるデータプラスSEとかもアップロードする感じだし
使いたいんであればBGMも普通にアップロードする感じだし
でも音声に関しては収録できたらいいじゃん
過去に全く別のものでGoogle AI Studioで収録用のツールも作りました
収録音声の収録 この声に関わる世界線で触れたね前に
収録プラス収録完了時点で全部文字起こしをして
あとは要約とタイムスタンプ作ったりとかボタンを押すといろいろ機能を発動するようにしたんだけど
ブログの記事マークダウン形式でブログの記事を出力するとか
ハッシュタグの広報を出すとかタイトルワンを10個出すとかサムネイルを作るとか
収録してその後に分析家庭に始まってみたいな感じのそういうものも作ってあります
これを2つを合算させるってなると指示自体がややこしくなるし
なんだかんだどっかでおかしくなってうまくいかなくなっちゃったりするから
ちょっと不安もあったんだけど収録のツール自体は一応試そうと思って今回つけてみました
とりあえずうまくいきました
だから音声もすでに録音してあるものをアップロードするのプラスその場で収録をして
音声クリップとして並ぶので
これをさっき言ったようにドラッグ&ドロップで場所を前後入れ替えられる
本当に間にSEを挟んで場面転換みたいな感じにしたり
音声広告用のファイルを用意してそれを間に挟み込んだりそんなことができます
ある種これはダラダラ例えば20分とか話しちゃうのよりも
ちゃんと整理した構成に持っていきやすいツールにもなっているかなっていうのがあります
これどういうことかというとこのなんか別件で触れたけど
例えばツイッターに投稿することはできるんだけど連続で何回も投稿することはできるけど
記事を1個長い記事を書くことはできないって人って結構いると思います
個人的にもそうなんだけど
でそれを解消するためのサービスツールとかってのも開発されていて
文は書けぬがつぶやけるっていうサービスがあって
この140文字ツイッターになぞられて140文字ずつかな
枠が用意されていてそこに文章を打てるようになっています
これがいっぱい並んでるので並んでるんだか1個埋めたら次のボックス表示して
追加みたいにしてやっていくのか分からないけどとりあえず単文ずつ積み重ねていけば
長文書けない人もツイートできるんだったら書けるでしょっていう
最後全部くっつければ長文になるわけじゃんっていうようなサービスがあって
ある種それと同じような感覚なんじゃないかなっていうのを持っています
つまりその場で録音ができるっていうことは1テーマごとに
この短時間の短い音声データとしてこの録音を繰り返す
そうすると自然にちょっと意識が働くので
この1個1個の間1個目2個目3個目4個目みたいな分割予定
意識が湧くと思うのでだからある程度テーマ絞り込んで
簡潔にしてみたいなことがやりやすくなるんじゃないかなと思います
本当にまんまさっきのツイートはできるけど文章書けないの書けないっていうのと一緒じゃん
しゃべるのに関しては俺自身は別にいくらでもしゃべられるからいいんだけど
ただ全然まともにもないさあっち行ったりこっち行ったり
なおかつあっち行ったりこっち行ったりすんのはいいんだけど
ちゃんと区切りとかメリハリをつけてっていうことができなかったりもあるので
本当は最初にテーマ全部決めてやれれば一番いいんだけど
そういう頭にも持っていきやすいか
細切れで録音してこれを並べ替えることもできるわけだし
間にSE入れるとかオーディションで細々と微妙な位置調整とか
秒単位の調整とかする必要もないじゃん
なんかちょっと違うなとかってこともないわけだから
そう考えると収録をしてよし一個終わったじゃあSEここに間に挟んで
DJのスクラッチみたいなのを入れてよしじゃあ次の話に行こうみたいな
そんなことやってるうちにパッと頭に浮かんでくるものってあるじゃん
分割していってるから
じゃあここに関係するもので今頭に浮かんだものを2つあるから
じゃあこの2つをこういう順番で収録しようかなって
1個の話でまた収録終わったら次の話ってできるから
結構整理して作りやすいっていうのもあるんじゃないかなとは思います
繰り返しになるけど本当に最初にYouTubeとかで考えたらそうだけど
まずサムネット企画から考えるみたいな話が本当に根本的なところってあるから
そういうほうがいいんだろうけど
この分割して収録するってところも含めて
自然な流れでそういう方向認識を持ってきやすいんじゃないかなっていうのも
ちょっとあるんじゃないかなって
感覚的には個人的にはあくまで雑談ベースというか
そっちをメインでやりたいっていうのがあるので
専門的にどうこうって発信するんだったら
俺はポッドキャストになってYouTubeでやるべきだと思ってるので
みたいなところです
と言いつつ今そのツールはちょっと微妙に手加えたりしてるんだけど
そうなんかね言った指示ねうまいことやってくんなくて
またわけのわかんねえ状態にされて
今イラッとしてる最中なんだけど