1. ピョン吉の航星日誌
  2. #1311 Googleの音声作成を使っ..
2025-09-30 04:52

#1311 Googleの音声作成を使って1週間配信して気付いた話

spotify apple_podcasts youtube

Google AI StudioのGemini speech Generationを使って、先週一週間、毎日音声作成でポッドキャスト配信を行ってみました。それを行い気付いた話をまとめてみました。非常に便利だけど、問題もいくつかありますね。それにしても、誤読を「もどく」と誤読しているような気がしますね。

サマリー

ピョン吉は、GoogleのAI StudioのGemini Speech Generationを利用して音声を作成し、多くの気づきを得ています。音声の品質や多様性、収録環境の簡便さに感謝しながらも、個性の表現の難しさや文脈理解の限界についても言及しています。

00:00
はい、おはようございます。本日の放送は2025年の9月30日、火曜日です。 本日は第1311回目のお話となります。
このタンネルは福島県郡山在住の特撮アニメ漫画大好きオヤジのピョン吉が響きになったことをだらだらと話をしていくという番組です。
よろしくお願い致しまーす。
音声作成の利点
本日はですね、ちょっといつもと経路を変えまして、先週1週間、このピョン吉の航星日誌ですが音声を作ったもので配信して試していたので、
その時に気付いたことをまとめてみたいと思います。 何を使っていた音声を作っていたのかというと、GoogleのAI StudioのGemini Speech Generationです。
作成できる音声に時間制限があるのですが、無料でいろいろなことができます。 自分が先週使ってみての感じたことを思いついた順に話していこうと思っています。
まず一つ目、自然で聞き取りやすい声ですね。 感情やイントネーションが人間らしく、棒読み感が少ないためリスナーにストレスを与えにくいと思いました。
読み間違いは少ないので編集も楽です。 昨日1週間ぶりに自分の肉声で作成してみたら愕然としました。
こんなに自分の声って聞き取りにくいのかと。 しかも声のトーンや発音の揺らぎがなくて、いつでも同じクオリティなのが嬉しいです。
二つ目、多様な話し方、声質を選べる。 フォーマル、カジュアル、落ち着いた声、元気な声など用途に応じてスタイルを切り替えられます。
基本30種類ありますが、さらに少し高めでみたいな希望を入れると音質を変えられます。 しかし結局みんなの好みはアナウンサー問いとか魅力的な声とか一部に偏るので、よく聞くAIの声だと感じられて、その時差別化が難しくなるんじゃないかと思いますね。
三つ目、スピード・抑揚の調整が可能。 話す速さ、強調、間の取り方を変えられるので、プレゼン・朗読、ポッドキャストなど場面に合わせた音声が作れます。
しかも出来上がった長さは、AIに読ませる元のメモの分量から長さを予測するしかないんです。 無料枠だと最大10分なんで、10分をちょっとでも超えると音声作っても再生できなくなるんです。
運良く10分以下だったとしても、原稿にミスがあった時に作り直しできなくなるんです。 一部だけ作り直して合成となるんですが、同じトーンなんで差が少ないとはいえヒヤヒヤです。
四つ目、収録環境を不要。 マイクや防音設備なしで高品質な音声をいつでもどこでも生成できるので、収録環境の準備や編集作業の手間が省けます。
これ非常にありがたいですね。環境音とか考える必要がないです。 五つ目、個々人の個性やアドリブ感が出にくい。
今後の活用法
基本原稿を読むだけなので個性を出そうとすると、原稿に指示を書き込むしかないんです。 いろいろめんどくさいんです。そこが面白いと感じる人だといいんですがね。
六つ目、文脈理解の限界。 強調すべきところや感情を込める部分を自動で完璧に判断できるわけではないため、テキスト側で工夫が必要になるんです。
これが難しい。 無読は少ないと思うんですけど、時たま変な無読しますね。
八つ目、作成されるのがWAVEでモノラル。 自分使っている編集がオーダーシティーなんで、一度MP3に変換する手間がありました。
いい編集ソフト使えばいいんでしょうがね。 ポッドキャストにアップするのも容量多くなりますしね。
九個目、対談形式にするのが楽。 対談形式の原稿を作るだけですからね。しかし対談形式だと伝えたい中身情報量がかなり少なくなっちゃいますね。
10分でも中身はほとんどない。面白い対談にすると思うと無駄話がどんどん増えて中身がなくなります。 自分はなんでこんな無駄話を書かないといけないんだろうと思うんですけれども、
出来上がっているのは聞いていると楽しいんですけどね。 で、今後どうするか。
いろいろポッドキャストで使い道がありそうです。 どのように使おうか考えています。
例えば長い原稿を前もって作っておいて、毎日一部分を作っていって、後で合成して長い番組を週1回配信の別番組作るとか。
あるいは番組の一部にミニコーナーを作って入れてみるとか。 いろいろと試してみようかと思っています。
というわけで、今回はジェミナイスピーチジェネレーションを実際に使ってみて感じたことというお話でした。
はい、それではまたもしよろしければピョン吉野るたくの話にお付き合いくださいね。 本日もお聞きくださいまして、まこありがとうございました。
04:52

コメント

スクロール