2025-06-25 06:36

868🤖万能音声AIアプリ版公開!ElevenLabsざっくり解説。音声クローン事例と精度は?どっちでAI化する?ElevenLabsとFish Audio比較

※リンクはアフィリエイト広告を含みます


✅️ 使用した音声クローンAI

万能型音声AI「Elevenlabs」

https://try.elevenlabs.io/xslt0g6h60gj 

「サクッと音声AIクローン」Fish Audio

https://fish.audio/?aff=QLO4F7WRJEUDC 


今回の配信に関連するツイート

https://x.com/Koukichi_T/status/1937625076138148053


---目次---

ElevenLabsスマホアプリ公開と音声AI比較の目的

ElevenLabsスマホアプリの概要と現時点での評価

ElevenLabsとFish Audioの音声デモの紹介

ElevenLabsの音声デモとアプリ機能の詳細

Fish Audioの音声デモ開始と自然さの比較

ElevenLabsのV3モデルとボイスクローンの課題

普段使いの推奨と総合的なサービスの比較

ElevenLabsが提供する多様な音声関連機能

ElevenLabsとFish Audioを改めて使ってみた感想

Fish Audioの長文一括読み上げにおける高い精度

Fish Audioの利便性と急ぎの収録への適性

自身の話し方と音声AI活用の考察

まとめと今後のコンテンツ発信について

初めて聞く方へのメッセージとエンディング


今回の音声では、普段から注目している音声AIサービス「ElevenLabs(イレブンラボ)」がスマホアプリを公開したという情報について、私の見解と体験談を共有しました。現在はまだ使える機能が限定的ですが、まず触ってみる価値はあると感じています。


私自身の声のボイスクローンを使って、ElevenLabsと、私が日常的に活用している別のサービス「Fish Audio(フィッシュオーディオ)」で同じテキストを読み上げさせた音声デモを用意しました。これを聞いていただくことで、それぞれの精度や特性、どのようなユースケースに適しているのかを確認していただけたかと思います。


結論として、音声の自然さ、特に長文を一括で読み上げる際の精度という点では、Fish Audioが断然優れていると改めて感じました。これにより、急ぎで収録したい場合でも、やり直しの手間が少なく、スムーズにコンテンツを作成できるのがFish Audioの大きな強みです。


一方で、ElevenLabsは非常に多機能で、TTS(テキスト読み上げ)だけでなく、STT(文字起こし)、ボイスチェンジャー、ダビングなど、音声に関する様々な機能が備わっています。特に英語での利用や、TTS以外の機能を重視する場合は、ElevenLabsが有利だと言えます。ブラウザ版であればこれらの多機能を利用できますが、アプリ版は現時点ではシンプルなテキスト読み上げに限られています。


どちらのサービスにも一長一短があり、用途に合わせて使い分けるのが現実的だと考えています。また、音声AIとの連携を意識して、自分の喋り方についても少し試みていることにも触れました。今後も、こうした気づきなどを短いコンテンツで発信していきたいと思います。


#聴くまとめ #音声AI #ElevenLabs #FishAudio #ボイスクローン #AI #TTS #ポッドキャスト #AIアプリ#音声合成 #生成AI 


--


✅️YouTube収録/ポッドキャスト/ライブ配信関連機材

🎙️今回の収録機材

🎙️Fifine AM8

Amazon ⁠https://www.amazon.co.jp/dp/B0BVVX5FBD?tag=kt_podcast-22

楽天 ⁠https://a.r10.to/hPmhN6

AliExpress ⁠https://s.click.aliexpress.com/e/_o2c0PgZ 


📷️WEBカメラ:Insta360 Link

https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6?ref_=aip_sf_list_spv_ons_mixed_d⁠

https://www.youtube.com/watch?v=tOtrGysvHNU


📎まとめ:YouTube収録/ポッドキャスト/ライブ配信関連機材

https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6

✅️使用アプリなど

音声編集:Adobe Audition

https://prf.hn/l/vwza4G3/ 

動画編集:Adobe Premiere Pro

https://prf.hn/l/614bQWX/ 

全部入りCreative Cloud 

https://prf.hn/l/3PqjAQJ/ 

Adobe Firefly 

https://prf.hn/l/9O5qVXD/

Adobe Express(アドビ版Canva/Firefly連携が良い感じ)

https://prf.hn/l/lQOq3yd/ 

--


✅️買ったやつ。ガジェット関連おすすめなどまとめ

Amazonマイストア

⁠⁠⁠https://www.amazon.co.jp/shop/kt.pics

Amazonの新機能です。楽天ルームみたいなかんじのやつ。

カテゴリ分けして載せてるので、気になるものあればコメントなどもらえたらポッドキャスト内で紹介します


--


✅️関連SNS

ブログ

⁠⁠https://koukichi-t.com/

Twitter(X)ポッドキャスト用

https://x.com/kiku_matome

Twitter(X)中の人

https://x.com/Koukichi_T


✅️YouTube

聴くまとめ YouTube版

https://www.youtube.com/channel/UCy42LheJtEhKSjquP9BgiGQ

ガジェット本音レビューチャンネル

https://www.youtube.com/channel/UCZzl7IurT1V8-HPrF0S07GQ

SNS関連情報チャンネル

https://www.youtube.com/channel/UCkDwn4gZY8VYHAxCkHynTWw


--


この番組はkoukichi_tが、SNS、エンタメ、ガジェットの話題を余談だらけで紹介していくポッドキャスト、まとまらなくてもまとめ「聞くまとめ」です。倍速再生、ながら聞きで情報収集に活用してください⁠⁠

※アフィリエイト広告リンク含みます⁠

以下でも聞けます!「聴くまとめ」で検索!

Apple Podcast/Amazon/YouTube/Spotify

サマリー

ElevenLabsがスマートフォンアプリを公開し、音声クローン技術を探求する機会が広がっています。Fish Audioと比較しながら、各サービスの機能と精度について検討しています。

ElevenLabsの音声AIアプリ
おはようございます。2025年6月25日、朝7時の収録です。
さっきツイートしたんだけど、普段から触れているElevenLabsっていう音声のAIサービス、こちらがスマホアプリを公開したとのことです。
現在は、使える機能はかなり限定的なので、あんまりおすすめっていうところまではできないんだけど、まず触ってみるってところにはいいんじゃないかなと思って今回情報の共有となります。
この後、実際にElevenLabsで読み上げをさせた音声と、その後に日常的に使っている別のおすすめのボイスクローンサービス、Fish Audio。
こちらの音声を両方とも入れてあるので、ユースケース的なところも含め、どんなものか、精度なんか、この辺りの確認としてもチェックしてみてください。
この後聴いてもらったらわかると思うけど、やっぱりFish Audioが断然いいなっていう、細かい機能とかはいろんなものはElevenLabsの方が圧倒的にいいんだけど、
ということでまずElevenLabsの音声、そしてその後Fish Audioの音声がこの後流れます。参考にしてください。
おはようございます。AIKTです。ボイスクローンの作成もできる音声、AIサービス、ElevenLabsがスマホアプリを公開しました。
iOS、Android両方いけるっぽいです。
スマホアプリではブラウザ版の音声生成、履歴の確認が可能。作成機能自体は現時点はシンプルにテキストトゥースピーチ音声、作成のみの印象です。
音声モデル選択や既存音声の読み上げ紙の調整スライダーなどはいじれます。
ここまではElevenLabsの機能を使ってKT自身のボイスクローンで読み上げをさせていました。
現在の音声は普段活用している別の音声、AIサービス、Fish Audioによるものです。
音声の自然さという点ではやはりFish Audioが圧倒的なようです。
ただしElevenLabsに関しては最上位モデルのV3というモデルが現在アルファ版として公開されています。
こちらは非常に自然な話し方をしますが、なぜか自分自身の声のクローンを使った時に極端に声がおかしくなり、まるで他人のようになってしまいます。
ElevenLabs側が推奨している音声モデルを使用した場合にはかなり流暢な感じで話してくれます。
そんな状況から普段使いでガツガツ利用するにはFish Audioが圧倒的にオススメと改めて感じました。
ただしElevenLabsにはものすごい数の音声関連の機能が備わっているので、総合的にはElevenLabsが有利と言えそうです。
特に日本語というところではなく英語などを主体として利用する場合には断然ElevenLabs良いです。
用途に合わせて使い分けのできる様々な機能の一部を紹介です。
音声クローン&カスタムボイス作成
TTS読み上げSTT文字起こし
ボイスチェンジャー機能
声データをアップロードして別の行為に置き換える音声スワップのような機能です。
サウンドエフェクト作成
スタジオ機能ではポッドキャストオーディオブック作成ができます。
ダビング機能
別言語への音声吹き替えが可能です。
その他会話型音声エージェント
ノイズ除去など
ポッドキャストの生成はもちろん
オーディオブックの作成にもぴったりだし
音声のAIエージェントという活用の仕方などもできます。
様々な機能が用意されているので
気になる方は概要欄からチェックしてみてください。
アプリ版では音声の読み上げという限定的な機能しか使えませんが
ブラウザ版であれば先ほど触れた内容が色々試せます。
音声クローンの比較
気になる方は概要欄からチェックしてみてください。
有料プラン依存の機能もあるため
この辺りはご自身の目で確認してみてください。
フィッシュオーディオとイレブンラボ両方とも
改めてこちらで使ってみました。
どうだったでしょうか。
やっぱりイレブンラボに関しては
結構イントネーション自体が微妙っていうところがあり
対してフィッシュオーディオに関しては
何を考慮することなく
イントネーション自体は
イントネーション自体は
フィッシュオーディオに関しては
何を考慮することなく
断然自然に流暢にっていう気がします。
もちろんおかしいところもあるんだけど
なおかつすごいのは
今聞いてもらった後半の方の音声
フィッシュオーディオ作ったものに関しては
さっき聞いてもらった音声丸々
あの長文を一括で読み上げさせて
あの精度になっています。
これイレブンラボでやったらイントネーションおかしすぎて
これは聞き苦しいなってなって
何度も何度もやり直しすることになると思います。
けどフィッシュオーディオではそういうことが起きない。
ここら辺がめちゃくちゃいい感じ。
例えば今回の音声に関しても
あんま時間ないけど
ある種速報的にちょっとだけでも
短い時間のものでも収録しようという
考えから今回配信に至っています。
そうやって急ぐときに
読み方、イントネーションがおかしいとかってなって
やり直しってなると
そういうことが起きづらい。
そして妥協できるぐらいのクオリティで仕上げてくれる。
ここがめちゃくちゃ強みかなと思います。
ちょっと今ふと思ったことがあって
今順番に冒頭で自分自身の声
そしてその後AIKTにサービス
そして最後に今また俺自身リアルKTになってるわけだけど
あえてちょっと淡々とした喋り方にしてみようかなと思いました。
なんかこうBGMとかに紛れて
あれどこで移り変わったのかなって分かんない瞬間とかも
過去の配信の中であったりしたんだけど
自分で聞き返した時とかに。
なんかより人間側が
AI側に近づけた喋り方をすると
あれどっちなんだろうというか
要は聞いてる人たち、特に新規層とかがさ
聞いた時にそもそも人間がずっと喋ってるって思って
そもそもそういう認識で
Podcastを聞き始めるとか
展開にもなるかもしれないし
別にそれが理想的だとかそういうわけではないんだけど
言ってみれば自分自身が喋ってると思ってもらえる
っていう状況になれば一番だと思うので
かといってAIに人間側が寄せてしまったら
元の子もないっていうところではあるんだけど
そんなところを思って最後の
話し始めとかに関しては
淡々とAIっぽくっていう感じにしてみました。
ということで今回は以上となります。
こんな感じで気づいた点なんかも
ボイスクローンを活用っていう意味合いも含めて
短いものとかもちょっと挙げていければなと思うので
今回初めて聞いた方は
耳編の聞くまとめと記憶してください。
よかったらフォローお願いします。
では今回は以上となります。さよなら。
06:36

コメント

スクロール