1. 栗林健太郎の音声
  2. #29 なりたい自分へのギャップ
2024-02-10 09:38

#29 なりたい自分へのギャップ

最近、声をいじることにハマっています。ボイスチェンジャーを使うことについて、話してみました。


----


途中で出てくる音声は、ParakeetVCでつくよみちゃんの音声に他の声をブレンドしたものを用いています。


00:02
こんにちは、栗林健太郎です。
最近は声をいじることにちょっと凝っておりまして、
前回のエピソードでも、音声周りの機材を購入したよって話をしたんですけど、
それはまあどっちかというと、音声のクオリティを上げるみたいな、
そういう方向でオーディオインターフェースを買ったりとか、
まあそういうことをしてたんですけれども、
クオリティを上げるというよりは、声そのものを変えるみたいな、
そういった取り組みもしていて、
例えば、最近だとAIボイスチェンジャーみたいなのが、
いろんなのが出ててですね、
そういうもので、割と簡単に声を変えられるようになってきている状況です。
じゃあ早速ちょっと試してみたいと思うんで、やってみましょう。
こんにちは。栗林慎太郎です。
今、声をボイスチェンジャーで変えてみてるんですけれども、どうでしょうか。
ちゃんと変わって聞こえてると思いますが、
こんな感じで、AIボイスチェンジャーで声を変えることができます。
という感じでですね、声を変えてみたんですけど、
先ほどの声は、パラキッドVCっていう、
去年の12月ぐらいですかね、
出た新しいAIボイスチェンジャーを使っているんですけど、
そのボイスチェンジャーを使ったものを、
先ほどお聞きいただいたという感じです。
今、声を入れ替えたのは、
今、Windows使っているんですが、
ボイスミーターっていう音声をミックスするミキサーみたいなのがあって、
入力を、今話しているのはマイクから録っているんですけど、
さっきの声が変わってたやつは、
ボイスチェンジャー経由の声を仮想インプットデバイスに入れて、
それを録っていて、
それを今入力を切り替えながら、
Podcastの収録に入れているので、
それでパッパッと切り替わったという感じです。
これをやるために、ミキサーのソフトウェアを入れてみました。
まだ使い方はよくわかんないんですけど、
こんな感じで気軽にいろんな声を使い分けることができるようで、
ちょっとこれもあれこれいじってみたいなと思っています。
声をいじることに興味があるのは何でかっていうところなんですけど、
技術的な興味っていうのももちろんあるんですが、
03:00
もうちょっと変えることそのものの話をすると、
バーチャル美少女NEMさんという方がいらっしゃるんですが、
その方が本を出されていて、
その本の中でなりたい自分になれるっていうのがすごく重要だという話をされていて、
VRとかだとアバターを着ますよね。
それでアバターを着ることで、
ビジュアル的な意味では結構なりたい自分みたいなのがある人にとっては、
そういうものになれるような環境っていうのが、
かなり整ってきたなというところがあると思うんですけど、
一方でまだ声というところは、
そこまで完全になりたい自分になれる、
簡単になれるかっていうと、
そういうわけではないんじゃないかなというふうに思えるわけですね。
もちろんさっきみたいなボイスチェンジャーがあるんで、
そういうボイスチェンジャーを使ってVRの中で活動している人もいるし、
あるいは男の人が女の人みたいな声を出すのを訓練してですね、
本当に女の人の声にしか聞こえないみたいな、
そういう訓練を積んだ人とかもいるし、
ボイスチェンジャーでも自分で頑張るでもいいんですけど、
声を変えるっていう取り組み自体は結構なされているんですが、
やっぱりそんなに簡単にできることではないですよね。
ボイスチェンジャーももちろん非常に性能が上がっていて、
すごいなって思うんですけど、
やっぱり機械的な感じはしますよね、聞いてみると。
じゃあもう一回聞いてみましょうか。
はい、またボイスチェンジャーで声を変えてみました。
こんな感じで、かわいいですよね、声。
たぶんかわいい感じの声になっているんじゃないかなと思うんですけど、
でもやっぱり全然自声というか人間が喋っている自然な感じかというと、
かなり自然だとは思うんですが、
聞いただけでわかんないなみたいな、
人間というか、自分で喋っているのかどうかわからないなというほどではないのかなという気はします。
でもこのParakeetVCっていうのは、これ自体の種類がすごくて、
いろんな人の声をブレンドしたりとか、
そもそも動作が軽いとか、
あと、いくつかソフトウェアの容量がすごく小さいので、
インソースの素早くとか、いろいろいいところがあるんですけれども、
まあ、こういう感じですよね。
06:02
はい、じゃあ戻します。
はい、そんなわけで、もう一度ボイスチェンジャーを使って喋ったんですけど、
それでその声というのは、やっぱりまだまだ仮想的な世界においても、
そんなに見た目をガラッと変えるほど、
うまくナチュラルに変わるというわけではまだまだないのかなという状況です。
なので、なりたい自分っていうのがあって、
そういうものになろうと思った時に、
そういう声も含めてなっていく。
VRの世界というのは、視覚的な、ビジュアルな世界と、
あと聴覚的な、オーディオ的な世界というのが両方あってVRだと思うんですが、
まだまだそういうところには多少ギャップがあるみたいなところはあるのかなという感じですよね。
もちろんVRだと、あとは例えば直角とか、
触る方ですよね。
嗅覚とか味覚とか、研究とかではそういうのもされていて、
そういう別の感覚についても再現性を持たせるみたいなことが研究されているんですけど、
それはちょっと置いておくとして、
ソーシャルVRみたいなところで活動するには、
ビジュアルとかオーディオとかそういうところが一番重要になってくるわけですけれども、
そのあたりも今後技術がどんどん進んでいって、
いろんな形でなりたい自分みたいなのになれる可能性みたいなのが増えてくると、
とっても面白いんじゃないかなというふうに思っております。
というわけで最近は声をいじるのが面白いなというような話をしていました。
あと今ボイスチェンジャーやってたんですけど、
それだけじゃなくて、例えばこの間ちょっとやったんですが、
自分の声を使ってAIのモデルを作るみたいなことも最近は結構簡単にできるようになってきて、
このPodcastで音声を取りためてあるんで、
それの10話分ぐらいのエピソードを使って自分の声を学習させてですね、
いかにも自分が喋ってる風な音声を売れるようなそういうものをやってみたりしました。
それも結構何も言われないでパッと聞いたら、
ちょっと録音が悪いだけで、
僕が喋ってると普通に思うんじゃないかなぐらいの感じにはなってて、
09:05
イントネーションが若干不自然だったりするんですけど、
パーッと喋っていれば、なんか話してるなみたいな感じぐらいには聞こえるんじゃないかなというようなクオリティーになっていて、
結構驚きだったりします。
その辺の話も後々できたらいいのかなと思ったりしております。
はい、じゃあ今日はこの辺で終わります。さよなら。
09:38

コメント

スクロール