音声クローン技術の紹介
皆さんこんにちは。フリーランスの学校に所属している海野です。毎週金曜日は、Udemy AIコースのベストセラー講師でもある海野が、
あなたの仕事と生活を楽にするAI活用術をお届けしていきます。
今日は、音声クローン技術がすごい、もうあなたが話す必要はなくなるかもというテーマでお話をしたいと思います。
これね、結構びっくりしちゃったので、ぜひぜひ最後まで聴いていただきたいんですけども、無料で試すこともできます。
私がですね、これまでいろいろと音声クローンの技術はね、使ってきたんですよ。
というのも私、喘息がありまして、1年に1回とか2回とかね、どうしてもやっぱりちょっと風邪をひいたりとかすると、あの喉がやられちゃうんですよね。
そうするとですね、喉がやられるっていうのかな、こういう息喚しがやられるっていうのかな、息をし続けることができない、あとは咳がすぐに出ちゃうとかね、
そんな状態になってしまっていて、今はね、割とちょっと声を低く話している感じになります。
なので、こういう音声クローン、自分の声を勉強させて学ばせて、それを自分の声のように話させるっていう技術があるんですけども、
そのAI技術にはすごく着目をしているんですね。
これまで私が試してきたことがあったのが、イレブンラボという技術と、あとはね、あれですね、声フォントという技術ですね。
技術というかツールかな。声フォントは日本の会社がやっているんですね。
声フォントのいいところは、一文字一文字のイントネーションも変えられるんですよ。
上げたり下げたりとか。なので、イチゴって言ったり、イチゴって言ったり、なんかそういうね、イチゴって言ったりとかね、そういうことができるのが声フォントなんですけども、
いかんせんちょっとね、一文字一文字変えなきゃいけないので大変っていうのがありました。
そして、イレブンラボはね、1年前ぐらいに使った時はもう全然使い物にならない感じでした。
というのも、またね、多分日本語の音声の学習が足りないんだと思うんですよね。
ひらがなはまだいいんだけれども、漢字混じりの文章になってしまうと、どうしてもね、漢字を中国語読みしてしまうんですよね。
なので中国語に、なんか日本語と中国語が混ざったような変な音声として聞き取りきれないみたいなね、そんな状況になっていたのが1年前ぐらいです。
なので日本語の音声クローンっていうのはなかなか難しいんだなーって1年間ずっと思っていました。
そこでですよ、今回ミニマックスオーディオというですね、新しいのかな、新しくないのかもしれない、
ハイルオっていう動画生成ツールに詳しい方だったらご存知かもしれないんですけども、ハイルオっていうですね、動画生成AIがあります。
ハイルオの会社が作った音声生成AI、これがミニマックスオーディオというツールなんですね。
これがね、すごかったの。私の声を学習させて、それでテキストとスピーチで文章を書いて、それを生成させたらですね、
びっくりな、私もびっくり、自分でも似てるなって思うような言葉を、割と自然な感じで喋ってくれたんですよ。
新しいツールの活用
ちょっと2パターンぐらい試してみたんですけども、そこまで大きな破綻っていうのはなかったです。
ただね、ちょっと一部うーんっていうところはありました。その辺はね、おいおい直っていくのかなと思います。
このミニマックスオーディオですね、すごく今人気みたいで、ランキングがね、AIユーザーたちのランキングがあるんですけども、
その中でも11Labとかを抜いて1位ということで、ミニマックスオーディオすごいんですよね。
こんなミニマックスオーディオのUI、ほぼ11Labなので大丈夫かなって思いました。
無料登録するとですね、1万クレジットが付与されます。1万クレジットでどのぐらいできるかというと、もうすんごいできます。
すんごいできる。もう今私1万クレジットで始めて、まだ8680も残っているので、たっぷり遊べますので、ぜひやってみてください。
自分の音声クローンは2通りのやり方で作ることができます。
5分以内の自分の音声、今しゃべっているような音声をアップロードするという方法が1つと、
あとは60秒以内の音声をこの場で録音するという方法の2つがあります。
アップロードとかにエラーが起きてしまうことが結構多かったんですけども、何回かトライしてもらえればいけるんじゃないかなと思います。
これができればうまくできれば、本当に原稿とかをAIで作らせて、それを入れれば原稿を読んでくれるじゃないですか。
めちゃめちゃ早いので作るのも。
これができるようになったらオンラインコース作るのも簡単だしいいなと思いました。
ショート動画とかも簡単にできるようになりますよね。
リップシンク、これとはまた別の話なんですけども、ヘドラっていう別の動画生成AIとかを使えば、
自分の写真とかイラストとかからリップシンクの画像を作って、自分が本当にしゃべっているかのように唇を動かしてくれるんですね。
それを合わせればショート動画とかも作り放題だし、すごい便利な時代になったなと思いました。
ちょっと一旦聞いてみていただければと思いますので、これから流しますね。
雑誌のような線画をサクッと描けたらと思ったことありませんか。
このGPT数を使えば素敵なラインアートが簡単に作れちゃうんです。
いかがでしたか。すごいですよね。
これ本当に私もちょっとびっくりしました。
最後のあたりとかちょっと違和感ありますけれども、全然許容範囲、言われなきゃわからないかなぐらいの感じですよね。
ちなみにこのGPT数は受け取り方を概要欄に貼っておきますので、よかったらまだIF中なのでもらってみてください。
それではまた。