1. 声に偏る世界線 - ポッドキャスト/音声配信界隈
  2. 本物と判別不能?音声クローン..
2025-06-21 27:56

本物と判別不能?音声クローンAIのポッドキャスト活用術と可能性「Fish Audio」ユースケース

この音声記事はこちら https://podcast.koukichi-t.com/2025/06/21/ai-voice-clone-fish-audio-usecase-for-podcast/

今回使用の音声クローンAI

Fish Audio(フィッシュオーディオ)

音声内目次

音声クローンAI Fish Audioを使ってみた経験と活用法 Fish Audio 短文ごとの生成と手間をかけた自然な音声作成 AI時代におけるポッドキャストの可能性とデジタル化への考え AI音声と人間の声の味わい深さ Fish Audio ボイスクローンAIの自然さの難しさと利点 Fish Audio 短文生成UIの使いやすさと履歴機能 Fish Audioを効率的に使う方法:外注やスタッフへの依頼 Fish Audio 実際の生成デモとモデルによる音声の違い検証 Fish Audio 感情表現のテスト Fish Audio 映画あらすじ読み上げの活用例とオーディオドラマ編集 今後試したい音声広告へのAI音声活用 Fish Audio 総括:時短・効率化ツールとしての有効性

関連エピソード「聴くまとめ」

865🎬️追憶連鎖:実写映画化「秒速5センチメートル」とAppleが認めた?フォトグラファー視点で観る「言の葉の庭」新海誠監督アニメ作品

音声要約

今回の音声では、私が音声クローンAI「Fish Audio」を実際に使ってみた経験と、その活用方法について詳しくお話ししました。冒頭の音声も、このAIを使って私の声を再現したものです。自分の声と比べると違いはありますが、かなり自然に聞こえると感じており、メインの番組では実用レベルで活用しています。

Fish Audioでは、短い文章ごとに音声を生成し、納得いくまで作り直すことができます。手間はかかりますが、これにより非常に自然な音声を作成することも可能です。私がメインで配信しているポッドキャスト「聞きまとめ」では、効率を優先して長い文章をまとめて読み上げさせていますが、ボイスクローン特有の課題(イントネーションなど)についても触れています。特に、自分の声のクローンを使う場合と、あらかじめ用意された音声モデルを使う場合の違いについても解説しました。Fish Audioは、少ない録音時間で自分のクローン音声を生成できる点がすごいと感じています。

このサービスが真価を発揮するのは、作業を第三者に任せる場合だと感じています。例えば、誰かに原稿を書いてもらい、その人に私の声のクローンで音声を生成してもらう、といった流れは、私自身が喋る時間を大幅に削減できるため、時短・効率化の観点から非常に有効です。現在の私の運用方法(自分で音声入力してクローンに読ませる)は非効率だと感じています。

また、具体的な活用例として、メインのポッドキャストで映画のあらすじを私のクローン音声で読み上げ、編集で差し込んだ試みを紹介しました。これにより、淀みなく内容を伝えられるというメリットがありました。Fish Audioのモデルによる音質や自然さの違いについても検証しました。感情表現のテストも試みましたが、明確な変化は感じられませんでした。

今後試したいアイデアとして、自分の声のクローンや他のAI音声サービスを使って、カスタム音声広告のようなものを作成・挿入することを考えています。音声AIの進化は、コンテンツ制作の可能性を広げていると感じます。Fish Audioは、特にボイスクローンを使った効率化や、新しい表現方法を試す上で興味深いツールだと言えるでしょう。

#音声クローンAI #AI #ポッドキャスト #AI活用術 #FishAudio #オーディオコンテンツ #クリエイター #ポッドキャスター #音声配信 #音声広告

※当サイトではGoogle Adsense/Amazonアソシエイト他、各種ASPによるアフィリエイト広告リンクを含む場合があります。

サマリー

音声クローンAI「Fish Audio」を活用したポッドキャストの利用方法とその可能性が紹介されています。AI技術の進化に伴い、音声の自然さや使いやすさを探りながら、ポッドキャスト制作の効率化を提案しています。特にFish Audioの機能とその利便性が詳しく説明されています。音声入力を活用することで、より自然な表現が可能になり、高い再現性が特徴となっています。音声クローンAIを利用したポッドキャスト制作のさまざまな試みや手法が紹介されており、新海誠監督の映画のあらすじを引用したり、オーディオドラマ的な要素を取り入れたりすることで、リスナーに新たな体験を提供する可能性が探求されています。

音声クローンAIの紹介
KTです。声に偏る世界線、2025年6月21日の収録です。
はい、今回は音声クローンAI、Fish Audioをちょっと使ってみます。
冒頭の方がAIで読み上げた音声になります。
こうやって隣に並べて、俺自身の声と比べるとそれは違うんだけど、結構自然に聞こえるんじゃないでしょうか。
この点に関しては、メインのポッドキャスト聞くまとめの方で何回も実用レベルで使っていて。
そうするとね、なんか自分で聞き返した時にもわからない判別つかない瞬間もあります。
今回実際に音声クローンサービスの画面を映しながら話しているので、Spotifyでビデオポッドキャストでの視聴がお勧めです。
これ、おかしいところがあったら、単文ずつにしてうまく読んでくれるまで、
例えば、KTレスのみでダウンロードができるので、ダウンロードして、
例えば次の文章をこういう風にして、声に偏る世界線、収録レスまでうまく読んでくれるまで何回も作り直してダウンロードとか。
手間はかかるけど、本気でやろうと思えばそれひたすら繰り返せば、もう人間のまんま、自分のまんまぐらいの状態までできます。
ただそれはあまりにも手間なので、聞くまとめの方でやっているのは、
だいたい長文をガッツリこんな感じで長文にして、最近は全部まとめて読み上げさせて、
AIを使ってやってますよっていうのも番組内でアナウンスもしているし、
多少変なところがあっても支障はないと思うので、
AIの紹介としてこのぐらいすごいですよみたいな表現であれば、何回もやり直してきっちりやってっていう手もあるんだけど、
そんな感じで使っています。
ポッドキャスト制作における活用法
例えば前回とかだと、ポッドキャスター的な視点から長くやって、
マイクとかそんなことはなくていいんじゃないかとか、そんな感じの話もしたりしたんだけど、
時代的にAIに世界中というか全体的に舵を切っていく中で、
ポッドキャストっていうのも少し前のノートブックLMとかの件もあるけど、
果たしてその存在意義自体があるのかないのかみたいな時代にも移行していくんじゃないかなというところはあります。
とはいえ別に不要なものって考えているわけではなく、
本だとかと一緒で、
俺は個人的にはとにかくデジタル方面にいち早く進んでいきたいし、
世間的にもそういう流れになってくんないと、
自分が損をするというか、早くもっと進んでくれれば便利なことって増えていくのに、
反対派の人たちのせいで止まっちゃうからなんだよみたいに思う派なんだけど、
デジタルに本がどんどん移行、ようやくなったよね。
ずっとそれをね、早くそっちに進んでくれないかと思っていて、
いつかこれ本当に浸透する日が来るんだろうかと思っていた中、
今ごく普通に受け入れられているから、ようやくここまで来たんだと思う中、
逆に当時から思っていたけど本自体はさ、
手に取って取るってことももちろんいいことだし、価値のあることだし、
個人的にはそっちはもうやめようって決めてやめたことなので、
もともとものすごい本とかも全部集めて、
コレクションというか収集壁とかもあってさ、
物理的なものから手放せないみたいな、
引っ越しのたびに大量にいろんなもの持ってって、
それやめようってバッサリ決めてから、
もう完全にデジタルに頭がいきました。
だから今はもう物理的な本は不要なものっていうふうに、
認識、そういうふうに習慣づけで頭はいってるんだけど、
とはいえものとしての本がいいなって思うのは、
もちろんその感覚的には残っています。
特に例えばメインの方でもこの前言ったけど写真関連、
写真をやっていたとか、やっているとかそういうのがあるので、
写真集とかは手に取ってみたいなって、
多少ないと思うところもあるし、
デジタルで写真集を見ても、
だったらウェブページで見るのと変わらないよな、
みたいな感じ。
例えば好きなフォトグラファーとかがいたとして、
ある種のおしかす的にデジタル版で買うとかっていう意味合いは
あるかもしれないけど、
そんな音声の方に関しても同様に、
全部情報収集っていうためだけで音声の読み上げになってしまう
っていうのはどうかなというか、
味わい深さっていうところでは、
もちろん人間の方がいいっていうところもあるので、
一概にばっさりそういうふうにAIにしましょうとか、
そっちの方がいいですよとか、
そういうことを言うつもりはないんだけど、
一個の手段としてはこの辺りも、
いろいろ活用できるところはあるんじゃないかなと思います。
例えば冒頭で読み上げさせた俺の音声が、
インターネッションがおかしいところがあるとか
って思う人もいると思うし、
例えばいろんなAIのサービスで、
より自然に読み上げをしてくれるサービスって
たくさんあると思います。
ただそれは重要なのは、
個人的に言いたいとか、
もしそういうふうに思っている人がいたとしたら、
ボイスクローンの場合とボイスクローンじゃない場合、
用意されている音声で読み上げさせて、
いい感じになるのってわけが違うので、
効率化の可能性
これは細かい技術的なこととか
そういうことを知っているわけじゃないんだけど、
あくまで自分が試した限りで、
もともと用意されている音声って
そのインターネッションとかも、
ある程度うまくいくような音声として
多分データが用意されているんだと思うので、
そこに対して、
自分自身の音声っていうのは、
自分が録音したものから作ってくれるって形になるから、
そういうわけにはいかないです。
そう、っていうのがあるから、
だから自分のクローン音声でここまでできる
このFish Audioっていうサービスはすごいと思います。
しかも録音時間、90秒から
2分くらいとかそのくらいの音声なので、
それでこれができているのは
本当にすごいと思う。
話があちこち行ったり来たりしてしまうけど、
このサービスで言うと、
さっき言ったように何回も
細切れで撮ってダウンロードして
やろうと思えば手間をかければ
結構完璧な状態にできるっていうところが
ここが面白い取り方というか、
ある種ツイッター的な感じでさ、
例えばツイートの140文字の繰り返しはできるけど、
記事を書くことができないみたいな人が
たくさんいると思います。
それ用のウェブサービスとかもあったよね。
文は書けぬがつびやけるみたいな。
140文字ずつの入力欄があって、
どんどん入力していって、
まとめて一つの文章として
ゲットすれば文章になりますよねみたいな。
それと同じで、
これもね、
UI的にこの細切れで作って
ダウンロードができるっていう、
それがね、
感覚的にすんなり入ってくるというか、
何て言ったらいいかね、
長文の方が手っ取り早いのはもちろんだけど、
そんでさ、
例えば3分分読み上げさせて、
最後の最後にとんでもない読み間違いをしてみたいな、
全部やり直したとかってなって、
つらいじゃん。
それを覚悟した上で、
俺は最近やってるんだけど、長文を。
それが、
本当にツイートみたいに、
単文単文でダウンロードできるっていうところ。
プラス履歴っていう画面に行くと、
ダウンロードしてなかったとしても、
生成をする都度、
全部履歴で残ってます。
そこからダウンロードもできます。
これがめちゃくちゃ使い勝手いいなっていうところ。
活用的なところで、
さっき言ったみたいに、
自分で録音したボイスクローンだっていうところが重要であって、
音声入力が難しくなってしまうからっていう中、
このフィッシュオーディがなかなかいいっていう話、
まず言ってあるんだけど。
これをボイスクローン、
自分の代わりに動いてくれるわけだけど、
例えば個人的に今使っているやり方って、
あんまり効率的ではなくて、
何でかっていうと、
自分自身で
音声とか台本を用意して、
むしろ、今ここであえてやるけど、
音声入力を基本、
何事に対してもPCで使っているので、
全て音声入力をしています。
このように喋っている内容を、
今音声入力中です。別のソフトを使って。
今、入力確定にすると、
こんな感じで文章が入るわけだけど、
だから、
クローンに読ませるための
自分のセリフ、
セリフを音声入力していると、
わけのわからない状態になっていたりします。
何も効率的ではないんだよね。
あんまり効率的ではない。
例えば、
あんまり淀みなく喋らせたいとかっていうことだったら、
フィラーとかも入らずってことであれば、
きれいに整った文章を書けば、
俺の声で読み上げてくれるからいいんだけど、
ただ、ここが有効活用するのであれば、
外注とかそれこそするときには、
めちゃくちゃいいなというところになるかと思います。
今、ここのチャンネルで聞いている人は、
どうなんだろうね。
ポッドキャストの番組として聞いてくれている人だとしたら、
自分がやろうというところの頭でなのか、
もしかして、やろうかなと思うけど、
これからやろうかなと思うけど、どうしようかなと思って
聞いてくれている人もいるかもしれないので、
一つの手段として、
時間がないのであれば、
自分で考えるとか、
自分の口調でとか考えて、
これを他の人に丸投げ、
外注なのか、会社とかだったら、
スタッフがいてだったら、
その人にやってもらうとかでもいいのかもしれないし、
第三者がこれを作業できるってところが
めちゃくちゃ、ここで効率的になると思います。
時短効率化に。
本人が動く必要がない。
だから、極端な話さ、
他の外注なり何なりの他のスタッフとかが、
自分自身の口調とかまで
把握している人であれば、
文章からして、
AIに頼みつつ、口調も整えてもらって、
文章を用意してもらって、
フィッシュオーディオじゃなくてもいいかもしれないけど、
これでやれば、
今これやってみようか。
この文章で、生成を押します。
そうすると、
全然短時間でできるので、
音声入力を基本、
何事に対してもPCで使っているので、
すべて音声入力をしています。
だから、今こういうふうに喋っている内容を、
音声入力中です。別のソフトを使って、
音声入っているね。
いきなり言わずっていたから、
もう一回作り直そう。
こんな感じでひたすら繰り返していく感じ。
音声入力を基本、
何事に対してもPCで使っているので、
すべて音声入力をしています。
今のだと割と自然だと思うけど、
プツプツ鳴っているのは、
実際の音声データのほうでは、
プツプツ鳴っていないことがほとんどです。
再生上プツプツ鳴ることが割と多いんだけど。
これはさ、今のって、
俺自身が自分で音声入力して、
これを他人に振っちゃっても、
完成するわけで、というところで、
時短効率化にはめちゃくちゃいいと思います。
だから、Podcastとかそういうのをやるにしても、
発信したいけど、
自分自身でやる時間がなかなかないという場合に関しては、
いいんじゃないかなと思います。
一応、せっかく触れているから、
この中身、
これは自分が録音したデータを
呼び出しているという感じになります。
モデルを指定して。
これが、この読み上げの
モデルが何パターンかあって、
ここで随分変わるんだけど、
今、S1という一番いいやつにしています。
いいやつにしたからいいかというと、
ちょっと似てなくなってしまっている気もするんだけど、
思いつつ、
このS1をひたすら使った状態で、
下のモデルに下げると、
なんか結構微妙だなと思ってしまうんだけど、
ちょっと試しに、マシな方、
V1.5という方、ちょっとこれで再生成します。
割とこれが一番自然になる
パターンもあります。
ただ、音質が音声入力を、
基本、何事に対してもPCで使っているので、
音質は下がる、明らか。
ただ、より自然に感じる瞬間もあります。
音声入力を基本、
何事に対してもPCで使っているので、
すべて音声入力をしています。
だから、今こういう風に喋っている内容を、
今、音声入力中です。
別のソフトを使っています。
ちょっとなんか変なところもあるかもしれない。
割となんていうのかな、
音声入力の利便性
あの、フィラーというか、
この内容を今みたいに繋ぐところで、
あの、あの、みたいな、
ちょっとそういうのが、
この間延びした音で繋ぐみたいなところを
表現してくれる瞬間があって、
それがすごいなと思って、
ちょっともう一回ここ削って、
もう一回やってみようか。
音声入力を基本、
何事に対してもPCで使っているので、
なんか上手っているね。
もう一回やってみよう。
こういう風に何回も繰り返して、
いい感じになるまでやるっていうのが、
最適な手段です。
ここではクレジット消費しないので、
音声入力を基本、
あーって変なふうになった。
クレジット消費しないでよ。
これは俺は有料プランにしているので、
無料プランでどうだっけな。
無料プランはクレジットが200でやっぱ制限はあるんだけど、
有料プラン月額月払いで、
いかなきゃな、
1500円くらいかな。
そうすると、このクレジットの概念自体が無限なので、
一回に生成できる量の
上限はあるんだけど、
無限だから何回繰り返してもいいんだよね。
ここがめちゃくちゃ使い勝手がいい。
音声クローンの再現性
ちょっともう一回再生してみます。
何事に対してもPCで。
これは変だね。
本当にこんな感じで繰り返しでできるので、
本当にね、
自分のクローン、音声入力を基本、
何事に対してもPCで
使っているので、
音声入力を基本、何事に対しても
PCで使っているので、
何事に対しても
伸ばしているところが人間っぽいなって気がします。
これは
喋り方としてはダメかもしれないけど、
割と俺も語尾伸ばしちゃいがちなので、
ここ聴いてもらえますか。
音声入力を基本、
何事に対してもPCで使っているので、
そうそう、これが今
自然に捉えられるか不自然に捉えられるか
人によって捉え方は違うかもしれないけど、
俺はね、こういう感じ。
今のがパーフェクトかわからない。
こういう感じが所々に紛れ込んでくる感じが
いいなと思います。
もう一回S1に戻してみます。
音質は確率に長いんだけど、
音声入力を基本、
何事に対してもPCで使っているので、
まだ悪くないかな。
もう一つ、V1.6。
これはね、結構かなり微妙だった気がする。
どんなんだっけな。
もう使ってないので、
音声入力を基本、何事に対してもPCで使っているので、
再生性。
音声入力を基本、
何事に対してもPCで使っているので、
今は比較的自然だったかな。
これ何だろう。
V1.6、コントロールベータ。
あれかな、コントロールの項目が違うとか話したな。
ここ一応いじれるようになってます。
項目は。
ボリューム、速度、温度、
トップ、Pみたいな。
何が違うんだろうね。
なんかよく、
他の音声AI関連で考えると、
このタグダウンだと、
例えば、
今回のは、このクレジットの消費無限だから
関係ないんだけど、他のサービスの場合は、
こういうパターンだと、クレジット消費量が
低くて、
その分ちょっと微妙だけど、
それなりに使えるみたいなのを見たことはあります。
例えば、イレブンラボとかだとそういう感じだったような
気がするんだよな。
みたいな感じで、どうでしょうか
っていうところで。
これは普通に概要欄にリンクは貼っておくので、
正体で、俺の方が得するやつはあるんだけど、
何ドル分か、
この月額が
足しになるみたいなやつかな。
なので、嫌な人は普通に検索していってもらえれば、
情報として得て、
参考になったらよかったら
そのリンクからやってもらったら。
とりあえず無料で、
約クレジット分はできるので、
ある程度できた気がします。
もう一回ぐらい何かやってみようかな。
じゃあ、
どうしようかな。
とりあえず、
特に話すことはないので、適当に話しています。
今、音声入力中です。
AquaVoiceっていうメインの聞くまとめの方では
しょっちゅう話している。
音声入力サービス、AI使うもの。
これで、直接入力だって
順番に入っていかないから、
分かりづらいと思うんだけど、
ちょっと難しいかもしれないので、
どんどん入力されていって、
最後に確定される感じになります。
ここで終わりにして、
入力確定します。
じゃあ、これを読み上げしてみよう。
V1.6にしてみるか、あえて。
この長文だと厳しいと思う、特に。
とりあえず、特に話すことはないので、
適当に話しています。
今、音声入力中です。
AquaVoiceっていうメインの聞くまとめの方では、
しょっちゅう話している音声入力サービス。
AI使うものです。
これで今、直接入力だって
順番に入っていかないから、
分かりづらいと思いますんだけど、
今、ちっちゃいウインドウみたいなので、
どんどん入力されていきます。
これもね、ちょっとね、
音声入力中です。
AquaVoiceっていうメインの聞くまとめの方では、
しょっちゅう話している音声入力サービス。
AI使うものです。
はい、これで今、ちょっと直接入力だって、
順番に入っていかないから、
分かりづらいと思いますんだけど、
今、ちっちゃいウインドウみたいなので、
どんどん入力されていって、
最後に確定される感じになります。
はい、ここで終わりにして、
入力確定します。
ヤバくない?
これ、まあ、音声入力時点でおかしいところが
あったりとかあるのと、あとはね、
英語のところは英語の発音になっちゃうことがあるから、
ここはもう手打ちで、例えば、AquaVoiceって
打ち直してあげるとか、
ここら辺の調整はもちろん必要にはなります。
ほらさ、結構自然じゃない?
今、本当に俺のリアルな声が入っているから、
比べたらそりゃ違うだろうしさ、
あると思うけど、
自分自身でね、
このフィッシュオーディオっていうサービスにさ、
最初に自分の声で録音するわけじゃん。
録音データが自分で聞き返せるかどうか
とかってのをちょっと把握してないぐらい
一番最初の時に、
初めて使った時、無料で使った時から、
時間2週間ぐらい経過して、
あ、そうだと思って、久しぶりに使ってみようと思って
使ってみた瞬間がありました。
その時に履歴みたいなところに行ったら、
それ再生してみたら、
あれ、これ俺自身が録音データ?
僕の音声の記録?
その再現用の、
それとして録音したデータかな?
って悩むぐらい、分かんなかった。
そう、でも今となっては、
機能とかさ、ちゃんと把握して、
俺がその聞いた音声は確率に履歴、
生成した履歴のところのデータだってのは
分かったので、間違いなく生成したものなんだけど、
自分自身でも分からないぐらいの感じ
ありました。
Fish Audioの機能
ちょっともう一回再生して、次のやつ作ります。
はい、とりあえず特に話すことはないので、
適当に話してみます。
結構自然だよね、話し方としても。
なんかちょっと気になれば、スペースを入れるとか
確か調節聞いたような気がするので。
はい、じゃあこれでS1、一番いいやつ。
これね、ちょっとね、消費しちゃってんだよな。
S1系モデルに関しては、有料プランでしか
確か使えなくて、
これ期間が決まってんのか、
いつまでは無料みたいになってました。
もう日付過ぎちゃって、今日21日なので、
過ぎると、APIクレジットっていうのが、
有料プランは10ドル分くらいかなんか、
APIで使う方のクレジット付与してんだけど、
そっちを消費してるって話です。
どうなっちゃってるのかな、今。
これで作ります。
作るのも早いしね。
とりあえず、特に話すことはないので、
適当に話しています。
音声入力中です。
アクアボイスっていうメインの聞くまとめの方では、
しょっちゅう話している音声入力…
どうでしょうか。
音質は上がるんだけど、逆に不自然になっているような気も
するんだよね。
これも何回もやれば上がることもあるんだけど、
あんまりちょっとあれかな、もう一回やってみるか。
なんかね、さっきのね、
V、とりあえず、
特に話すことはないので、
適当に話しています。
今、音声入力中です。
アクアボイスっていうメインの聞くまとめの方では、
しょっちゅう話している音声入力サービス、
AI使うものです。
今のは悪くないか。
なんかね、でもやっぱ、どっちかっていうと、
人間っぽい自然さ。
特に俺みたいにグダグダ話している人間の感じに近いのは、
V1.5の方が迫る感じがあるような気がします。
V1.5の感じで音質が向上してくれたら、
めちゃくちゃヤバいんじゃないかなっていう気はします。
ちなみになんかね、
これちゃんと多少作用しているかな。
感情表現も一応加えられます。
なんかね、明確に変わったかっていうのはちょっと分かりづらいんだけど、
分かりやすいようにしてみようか。
まず最初にここを普通の、
はい、とりあえずは普通の感情にしておいて、
ここを怒りとかにしてみようか。
露骨にね、
怒っているみたいな感じがないから、
んー、ちょっとまた悲しいにしてみます。
脅しとかある?脅し。
じゃあこの、今、音声入力中のV1.5の方が、
脅しにしてみよう。脅し。
まあ、視覚で分かると思うので、
聞くまとめのところから、
じゃあ、絶望。
んー、そして、じゃあこの、はい。
ってとこから、また別の。
焦る。
ちょっと文章がおかしいところは、
もう入力側でおかしかったのでごめんなさい。
あとはね、イライラする。
えー、最後までちょっとやってみようか。
これクレジットの消費、
違うのかな、なんか、この分。
あ、あとはね、トーンとか。
明るい声。激しい口調とかある。
激高の口調だって。
激高っていうの?激高?激高。
これじゃあ色々混ぜてみようか。
さらにもう一個、特別
泣きながらとかある。
絶望で泣きながらとかいいじゃん。
えー、ちょっとこれでやってみます。
あ、ちょっと楽しみ。
多少は試したんだけど、
はい、とりあえず、
まあ、特に話すことはないので、
適当に話しています。
今、音声入力中です。
今、音声入力中です。
Aqua Voiceっていうメインの
絶望聞くまとめの方では、
しょっちゅう話している音声入力サービス、
AI使うものです。
これで今ちょっと直接入力だって、
順番に入っていかないから、
分かりづらいと思いますんだけど、
今ちっちゃいウィンドウみたいなので、
どんどん入力されていって、
最後に確定される感じになります。
はい、ここで終わりにして、
入力確定します。
何も変化ないかな?
何か興奮するとか、
何か怒っている感じのやつとかって、
明らかに反映した気もするんだけど、
何かこことか普通に読み上げちゃったね。
ここはちょっと謎。
重複できないってことなのか。
じゃあ、分かりやすい
泣きながらとかちょっと頭に入れてみよう。
泣きながらと脅しと、
ここら辺が分かりやすそう。
長いかちょっと押しよう。
はい、とりあえず、
特に話すことはないので、
適当に話しています。
音声入力中です。
AquaVoiceっていうメインの
聞くまとめのほうでは、
しょっちゅう話している
音声入力サービス、
AI使うものです。
いや、分からんね。
全然泣いてないね。
ちょっと分からない。
けど、どっちにしても、
結構自然にできるってことは
伝わったんじゃないかなとは思います。
こんな感じで、
こんな方法もありますよというところで、
音声クローンAIの活用
いい使い方ないかなと思ったときに、
まあいい使い方かは分からないけど、
例えば最近やったものだとメインのほうのやつだと、
映画とかそういうものの
話題に触れたときに、その作品の
あらすじ、ぐだぐだ
こう話している中で、
全部取り切った後に、そっかあらすじ入れたほうが
いいなと思ったので、どんな作品か。
俺の言葉ではなくちゃんとした言葉で。
なのでそれを
Amazonプライムビデオのとことかから
引用してきて、それを途中に差し込んだ。
差し込むと俺の声なんだけど、
本当に淀みなく、そのまま綺麗に
読み上げてくれるので。
みたいな感じとかちょっと試しました。
あとね、そんなことしたら、
基本一発撮りっていう風に動画のほうで
引きまとめてやってたんだけど、
最近ね、長くだらだら話したものを
分割して投稿したりとかも試していたりして、
要は取りダメみたいな感じ。
一本で撮って、いろんな方向に話が飛んでいるから
それを分けて投稿したりもしています。
その中の一つとして、さっき触れた映画。
具体的にはあれかな。
新海誠監督の作品について
触れたのかな。
ごとの葉の庭とかに触れた回があったんだけど。
ちょっとこれはリンク貼っておきます。
それ聞いてもらうと分かりやすいと思うので。
それであらすじのところは、
自分のボイスクローン、このサービスで
使ったもので作って、なおかつ
動画編集が必要になってしまうので、
どうするんだろうと思って、
そのシーンだけ曲を変えてみたりとか、
あとはオーディオドラマ的に背景に
SE入れてみたり。
例えば、ごとの葉の庭とかって雨がテーマの
作品なので、雨の音を鳴らしたりとか、
他にも車が走っている感じの音を
鳴らしたりとか。
それはやってるのも楽しいし、
聞く人側がどうかって反応・フィードバック
もらってないか分かんないけど、
なんかね、ポッドキャストでそういうのって
流石にあんまない気がするので、
オーディオドラマって作ってるもんなら
あるだろうけどさ。
雨プラからあらすじ院友で紹介です。
小学生の高木とあかりは特別な思いを抱き合う中、
しかし卒業と同時にあかりの引っ越しにより
離れ離れになってしまう。
中学生になり文図を重ねる二人だが、
今度は高木も鹿児島への転校が決まる。
引っ越す前にあかりに会おうと
大雪の中、高木はあかりのもとへ向かうが、
時は過ぎ茶枝島で高校3年生になった高木は、
同じクラスのカナエに好意を寄せられながらも
ずっと遠くを見つめていた。
カナエにとって高木は一番身近で
遠い憧れだった。
やがて東京で社会人になった高木は、
仕事に終われ日々輝きを失っていく街並みを前に
忘れかけたあの頃の記憶に
思いを巡らせる。
なんかちょっと、
変化に富んだ感じ?
一つのこのエピソードの中で。
みたいなのを作っているのも楽しいし。
そう、みたいな感じの使い方ありかなと思いました。
映画あらすじの引用
あとは、これは自分の声でやるつもりはないんだけど
あとやろうとしているのが
音声広告的なものを挟むのを
自分で作ったものを入れようかなと思っています。
これはね、実は昔
Spotify for Creatorsが
アンカーだった時代
収益化機能がなぜか使えるようになって
そのアンカーを使って
自分で作ったものを
収益化機能がなぜか使えるようになって
最終的に払ってもらえなかったんだけど
日本は非対称ということで。そこ分かったままで
機能を使えるようになったから
お試しと思って使ったから別に構わないんだけど
その時にはね、自分で読む感じの
形で広告を入れてました。
要は、そのSpotifyじゃない
アンカー側の広告
いろんな企業とかが
広告を出してというケースもあるんだろうけど
最初の状態で使えるものって
アンカー自体の広告を
紹介として読み上げたものを
音声として挿入してください
みたいなのがあったのね。それで
1再生ごとにいくらってカウントされていくもの
実際にカウントはされていったんだけど
だからアンカーの紹介をした文章
俺自身が作って考えて
間に挟む。昔のアンカーって
音声の編集機能が
ちょっと付いていたので
何個かのブロックに音声を分けておいて
こことここの間に音声
広告を挟むとか、そんな設定ができたり
しました。今はもう全然何もできなくなっちゃったけど
だからそれを毎回の
エピソードの中に自分で挟み込んで
みたいなことをやったので
割と
実際にお金入ってきてはないけど
収益モデルとしての
活用方法というところは
実際に試していたりはしました。
合わせて別で
完全に別で
自分用のものとして
アピュレート的な感じで
広告の挿入と収益化
紹介したい対象に関して
具体的にやっていたのはブラウザかな
仮想通貨ブラウザに関して
概要欄のリンクから飛んで
こっちに収益として入ってくるし
その時のあれかな
使う側の人にもメリットもあったものだったかもしれないけど
それを自分で広告として用意して
用意して入れる。各エピソードにカットしたものを
加えてとかもやっていました。
そう。もう随分そんなこと
やんなくなっちゃったけど
自分の行為でもいいし
ちょこっとしたところに挟む感じ
例えばそれこそこのフィッシュオーディオの
広告みたいなこんな感じで
クローン音声が簡単にできますって言って
概要欄からリンク
よかったらチェックしてみてくださいっていう
自分専用の広告だよね
アフィリエイトでの。っていうやり方もあると思うし
今回のアフィリエイト広告みたいなの
挟むっていう件に関しては
前から考えたけどなかなかやるタイミングなかった中
そこに関して明らかに広告って
もう明示するって意味合いの
ことも含めて
カスタムボイス。俺の声ではなく
ちゃんと読み上げてくれるきれいな音声とか
そういうことができるサービスあるじゃん
うん
そういうのを使って入れるのありかなとか
ちょっと考えていたりします。あ、そうそうそうそう
ちょっと話取れちゃったな。それでもないか
今の件とプラス
さっき俺が自分自身の声でやった
なんかオーディオドラマっぽい瞬間
アラスジュを読ませるっていったところ
そこのS入れたりとか
っていう話とちょっとくっつけると音声広告的に
なるじゃん。ちゃんとした感じで
読み上げさせて本当に
短いオーディオドラマっぽくして音声広告挟む
なんていうのも面白いんじゃないかなっていう感じ
プラス概要欄飛んでもらって
収益になるともちろんそれもいいだろうし
そう、そんなところをちょっと考えている
最中だったりします。これは近いうち
ちょっと試そうかなと思っているので
はい、ということで、いつもの感じと全然
違う感じになったけど、一つの形として
音声AIクローン
っていうのも活用するのは
ありなんじゃないかなっていう。特には本当に
あれだよね。本当に自分のクローンとして
他の人に任せてやってもらう
っていうところでこそ最大限の
効果を発揮できる
っていう形にはなるんじゃないかと思うので
はい、ということで、このサービスに関しては
繰り返しのないけど、リンクの方は概要欄に貼っておくので
よかったらそちらからチェックしてみてください
はい、ということで今回以上となります
さよなら
27:56

コメント

スクロール