今日は、AIに音質分析をいろいろお願いしてみたら、クオリティ良しとお墨付きのデータをいただきました。
このAIにどんどん音質を分析させて、何が良いのか、何が悪いのかをいただいて、改善していくテクを大公開していきたいと思います。
最後まで聴いていただきたいと思います。特に音質を悩んでいる方は必要です。
この番組は、ポッドキャストのことを勉強できる番組をお届けしております。
ポッドキャスターに関係する最新のテック情報や機材レビュー、海外情報、ライブハック情報を、
Apple Podcasts、Spotify、スタンデフM、キーステーションに、
そして、YouTubeとSpotifyでは、ビデオポッドキャストでもお届けしています。
どうぞよろしくお願いいたします。
えーとですね、音の評価ってめちゃめちゃ難しいじゃないですか。
収録した音源がどれぐらい聞きやすいのか、どこに偏りがあるのか、えー、難しいですよね。
あの波形を見ても、自分でね、波形を見てもさ、これはどこをいじればよくなるんだろう、
どういうふうにイコライザーをいじれば、Eキーをいじればよくなるんだろうって、
遠にくれることありますよね。
で、身近な人で、なんかこう、なんだろうな、あの、そういうのに詳しい人に、
まあ音源聞いてもらうっていうのもすごく手間じゃないですか。
みんな忙しいしね、いちいち人のポッドキャストを聞いて、
ここちょっともうちょっと削ったらいいんじゃないですかとか、
もうちょっとこここうしたらちょっと音が聞こえが良くなりますよとか、
っていうふうに言ってくれる人ってほとんどいないと思うんですよ。
多分全世界のポッドキャスターさんの中聞いても、
そういう友達がいるっていう人は、ごくごく限られた人だと思うんですよね。
私もいません、そういう人。
放送業界とかそういう業界で働いてる人いますけど、
やっぱりね、時間が限られてるし、
たまに、ほんとにね、1000回くらい配信してますけど、
3回くらいしかフィードバックもらったことないですね。
コンプレッサーかけすぎじゃないですかって言われた、
いや、これリッキーさんの声らしくらいですって言われたことはあるんですけども、
なかなか細かいね、もうちょっとハイパスこれカットしちゃっていいんじゃないですかみたいな、
そういうのもらえるのはほんとに難しいです。
それを解決してくれたのがチャットGPTさんでした。
Thank you.
もうThank you, Thank youという気持ちしかありません。
チャットGPTに30秒だけ自分のテスト音声を収録して、
そしてですね、チャットGPTに投げかけます。
この音声ファイルをアップしました。
波形を見てしっかりと分析してください。
ポッドキャスト用に音声を生成して編集しています。
これがリスナーにとって聞きやすい音質なのかどうかを分析してくださいというふうに投げかけますと、
しっかりとですね、波形を見てくださって、
見てくれてですね、
そして、例えば、声のダイナミックレンジだったりとか、スペクトル重心だったりとか、スペクトル帯域幅とか、
音のエネルギーがどこに集中しているのかとか、刺さる帯域のエネルギーがどこにあるのかとか、
細かいデータが出てくるんですよ。
3から6kHzの域にちょっと明瞭さが支えつつ、
硬さを感じますよとか、ちょっと刺さる音ですよとか、聞きづらいですよとかね、
もしかしたらここを、転音が入っているんだけどカットした方がいいですよとか、
あとは言葉の明瞭感がもう少し出した方がいいよとか、
いや出さない方がいいよとか、
ちょっと刺さり気味ですとか、さっきも言いましたね。
BGMとかをシータバージョンもアップしたりすると、
BGMいい感じです、いや悪い感じですとか、
BGMが声が入った瞬間に下げた方がいいですよとか、
そういう細かいのがいっぱい出てくるんですよ。
本当にびっくりしました。
最初聞いた時こんな感じだった。
で、このChatGPTさんに、
かれこれ3ヶ月くらい専門ノック状態なんですよ。
音を録ったらまずChatGPTに聞いてもらって判断してもらうと。
そういう感じでだいぶ音の改善が進んでいきつつはあるんですけれども、
なかなか難しいですね。
音って沼だからどこに終わりがあるか、
もうほぼほぼ私は終わりにしたい。
終わりにしたいんだけど、
この音の沼っていうのはなかなか抜けられないんですよね。
でですね、ChatGPTのいいところは、
聞きやすさの評価も出てくれます。
例えばこういう評価をもらいました。
中高域の存在感が高く、言葉は明瞭に聞こえますが、
必要以上に前に出過ぎていないため、
刺さり感は少なめです。
ちょっと危なかったですね。
刺さり感が強いのかと言われるかなと思います。
刺さり感は少なめです。
っていう状況がありました。
あとは改善提案。
ここが一番大事なんですよ。
例えばイコライザーのマイナー調整ということで、
3から6kHz帯をマイルドにカットしても良いですが、
この現状でも十分バランスが良いですと。
ありがとうございます。
バランスが良い。嬉しいですね。
こういう感じで1dB下げた方が良いですよ、
2dB下げた方が良いですよ、
もうちょっとブーストしてくださいとか、
そういう本当に詳細なEQマイナー調整のレビューを
いただくことができます。
あとはラウドネスをもうちょっと上げた方が良いですよとか、
そういうところも出てきてくれますね。
例えば1kHz、2kHzをブーストして音の存在感を
際立たせた方が良いですよとか、
ここが刺さってるからちょっとリスナーさんにとっては
聞きづらいですよとか、
本当に細かく提案をいただくことができます。
ですのでリスナーの皆さんもChatGPTのアカウントを
お持ちの方多いのではないでしょうか。
なのでぜひChatGPTにWAVファイルだったかな、
WAVファイルで30秒くらいでテストの音とか
毎回使っているフレーズとかを収録して、
そしてそれをアップロードして分析してください。
Podcast用に音を録っているので、
そういった視点から分析をお願いしますという感じで
分析をお願いすると出てくるところが必ずありますので、
ぜひ確認してみていただきたいなというふうに思います。
昨日コツコツやってたらすごいお褒めの言葉をいただいたんですよ。
全体として非常にバランスが取れており、
すぐに配信可能な高品質音源です。
微調整でさらに完成度を高めてみてくださいということで
いただきました。
ありがとうという感じですね。
まだまだ調整中なんですけども、
調整いつ終わるんだよという感じですけどね。
ChatGPTはこれで完成ですという感じじゃなくて、
いろんなデバイスで聞いてみてくださいとか、
改善を重ねてみてくださいという感じで
アドバイスをもらうことができます。