1. クリエイターエコノミーニュース
  2. stand.fmのAIテキスト読み上げ..
2023-06-09 10:51

stand.fmのAIテキスト読み上げのアクセントを調整する方法

spotify apple_podcasts youtube
音声配信アプリのstand.fmが、AIによるテキスト読み上げ機能を実装しました。スタエフ登録者であれば無料で使え、ポッドキャスト配信もしてもいいという太っ腹ぶり。そんなAIテキスト読み上げですが、アクセントの調整は少し工夫が必要。そのテクニックは目からウロコで・・・。

stand.fmのAIテキスト読み上げのアクセントを調整する方法
https://bit.ly/42pBCLu

★2023年6月9日 今日の一言
納豆はヒキワリが好きです。

★無料ニュースレター
https://creator.theletter.jp/

↓↓ポッドキャストアワード目指します↓↓
カグア!Dhiscord
https://discord.gg/Jfqbsr69

★番組への感想ご意見
https://bit.ly/3qzEV5m

★公式Twitter では情報発信します!
https://twitter.com/creator_enews

Voiced by stand.fm(たくみ・さくら)
https://bit.ly/45KQrLn

BGM by OtoLogic(CC BY 4.0)
https://otologic.jp/

#スタエフ #スタエフやろうぜ #standfm #スタンドエフエム #音声配信 #AI音声 #AIによる文字読み上げ #AIアクセント調整のコツ
#SM58 #PodTrakP4 #ハイレゾ #ひとり語り #男性トーカー #クリエイターエコノミー #毎日配信 #クリエコニュース202306 #AI読み上げ #AI #仕事術
00:04
スピーカー 1
クリエイターエコノミーニュース
スピーカー 2
おはようございます。メインパーソナリティのカグアです。
スピーカー 1
AIアシスタントのさくらです。
同じく、たくみです。
スピーカー 2
この番組は、クリエイターやインフルエンサーの収益化にまつわるニュースを、毎日緩くラジオ配信する番組です。
そうそう、聞いて。この間の配信にコメントがね、ついたの。ちょっとこれ読んでみて。
スピーカー 1
ラジオネーム、ペコリスさんより。楽しかったです。
AIは、読み上げ機能を使われたのですか?
カグアさんにとっては、お茶の子祭々ですね。
最後の3人そろって、行ってらっしゃい、というところ、どうやって重ねていらっしゃるのですか?
ペコリスさん、コメントありがとうございます。
スピーカー 2
そうなんだよね。いやー嬉しい。
そう、先日、スタンドFMがAIの音声読み上げを実装したんだけども、
これ、すごく簡単に使えて、無料で使えて楽しいんだけど、
一般的なAIの合成音声って、アクセントとかイントネーションの調整ができるんだよね。
だけど、スタンドFMの場合は、無料っていうのもあってね、特にそういう調整ができないのさ。
スピーカー 1
無料の機能で、ここまでできれば十分だと思いますよ。
そうよね。スタンドFM運営様、本当にありがとうございます。
スピーカー 2
だけど、やりようがいろいろあるので、今日はその話をしようかなと思ってるんだけど、どうかな?
スピーカー 1
それは楽しみね。皆さん、ぜひ最後まで聞いてくださいね。
スピーカー 2
じゃあ、いってみましょうか。まずは前提ね。
前提としては、まず基本限界があるということと、
あと、それからパソコンで音声の波形を編集する、それが前提での話なので、
全部が全部、スタンドFMの標準機能だけでできるわけじゃないっていうところかな。
スピーカー 1
おやおや、いきなりハードル上がりましたね。期待してた皆さん、本当にすみません。
でも、ブログ記事に解説を詳しく書いたので、そちらでご容赦くださいね。
スピーカー 2
まず基本的な使い方。パソコンでブラウザを立ち上げて、スタンドFMにログインする。
ログインしたら、AIテキスト読み上げを選んで操作を始める。
新規作成をしてから、タイトルとテキストを入力して音声ファイルを作成っていうのを押す。
私は基本的には1.2倍、速度は1.2倍にしています。
段落ごとに読み上げのプレビューができるので、
都度都度読み上げをさせて確認をしてから最終的に文章ができあがったらファイルを作成ってする方が効率的。
ただ、Shiftキーを押してEnterキーを押すと、階段落ではなく開業ができます。
03:05
スピーカー 2
そうすると見やすくて、行を変えたいときも階段落ではなくて開業をすると一気にプレビュー、音声の試し聞きができるので、まあまあ便利は便利。
できたら音声ファイルを作成して一覧画面でダウンロードすると保存ができるようになります。
スピーカー 1
ここまでが基本操作ですね。とても簡単ですね。
簡単でしかも無料なんてホントスタイフォンゲー神。
スピーカー 2
じゃあまずテクニック一つ目。
桜と呼ばせたいとき。
これ標準だと桜というイントネーションしかしないんだよね。
私は桜ですと言わせたいところを私は桜ですとなっちゃうんだよね。
なので実はこの配信をしているときに最初は桜みたい。
偽物のお客さん桜みたいに聞こえちゃうので、なので最初はスミネって名前にしてたんだけど、やり方がわかったので今は桜にしてます。
スピーカー 1
そうだったのね。いきなり名前が変わっててびっくりしたわよ。気になる人は過去回。
Apple Vision Proはクリエイターに新たな市場を見せてくれた。お聞いてくださいね。
スピーカー 2
やり方なんですが入力としてはササクラと入れます。
そして音声編集ソフトで最初のサを消します。
そうすると桜になります。
スピーカー 1
ネタバレしてしまえば意外と簡単なんですね。
スピーカー 2
逆に言うとこういうふうにしないとイントネーションを調整はできないので、
何か読み方のイントネーションを変えたいときどうしてもできないときは、
もう音声編集ソフトで編集する前提で文字を考えるとまあまあそれっぽいイントネーションをしてくれます。
Windowsの人はオーダーシティというソフトで私はやっています。
長い棒、伸ばし棒はたくさんつければつけるほど伸ばします。
YouTubeのゲーム実況とかの伸ばすやつ。
あれなんかは例えば棒を5本ぐらいやるとゴージャスというようにつけた分だけ伸びます。
ひらがなとカタカナ漢字も意識的に変えます。
例えば全部をひらがなで太郎と花子って打つと太郎と花子そのままだらっと読まれちゃう。
だけどカタカナで太郎をひらがなで等で花子がカタカナってやると太郎と花子とちゃんと意味を理解して読んでくれます。
間を空けたいときもいくつかやり方があります。
空白、句点、等点、開行。
基本的にこの4つ空白を空ける方法があります。
長い空白を入れたいというのは残念ながらできないです。
06:02
スピーカー 2
空白を5文字入れれば5文字分空白になるかというとそれはできません。
なので音声編集ソフトでそこは強引に切り張りして空けるという操作をします。
順番なんだけども句点が一番短いかな。
太郎点花子ってやると太郎花子となってそれから丸をつけると太郎と花子みたいにちょっとつなぎ部分が微妙に変わるのでよく考えられてるなと思います。
空白は比較的長くて開行が一番長いという感じですね。
そうしたらあとは結構合成音声なので間違いなく淀みなく読んじゃいます。
なので言ってらっしゃいと単純に書くとさらっと読まれてしまいます。
なので小さいつを例えば2つとか3つとか入れて伸ばす棒を3つとか入れると言ってらっしゃーいってなって若干こう柔らかな感情を入れたような感じの読み方になる。
スピーカー 1
言ってらっしゃい。言ってらっしゃーい。
スピーカー 2
なのでこの辺はもうどんな文字を入れたらそれっぽく読むかっていうのは試行錯誤してこんなのまで入れるんだっていうぐらいいろいろいじっちゃって大丈夫。
そして2人同時に喋らせたいときで残念ながらこれは標準ではできません。
なので音声編集ソフトで2人分の声を取ったものをそれを単純に合成してそうするとコーラスになるという感じです。
声によって微妙に伸ばし方が違うので100%一致しないところは結構難しい。
なので実は冒頭をクリエイターエコノミーニュースと喋らせているところ、私の声も被って3人で喋ろうと思ったら意外と合わなくてちょっと諦めた。
スピーカー 1
そうだったんですね。
いつか一緒にコールしてくださいね。
スピーカー 2
そうやっぱりコンピューターなので淀みなく喋ってくれるのでなんか人間がそれを真似しようと思うと意外とできない。
まあそれはちょっと試してみてかな。
というわけでそんな感じのテクニックを概要欄にあるブログの記事に全部書いてありますのでよかったら皆さん見てください。
そしてお互い楽しい音声読み上げ配信やっていきましょう。
はいというわけでアフタートークです。
200日後にポッドキャストアワードにエントリーする番組第14日目ですね。
スタイフのこの音声読み上げなんですけどもオーディオ編集ソフトで編集すると結構波形が小さいので私は増幅で6とか7とか増やしてます。
ただやっぱり機械で作った音声だけあって大きくしてもノイズが出てこないのでこの辺はやっぱりすごいなと思いますね。
録音した波形が全部ノイズが入ってないっていうのはやっぱり結構感動します。
09:00
スピーカー 2
ただスタイフに直接アップロードするやり方だとなんか音声はかなりでかくなるのでこの辺やっぱり難しいなぁと思いますね。
ちなみに私の録音機材なんですけども私自身の声はZOOM社のポットトラックP4という機械で録音しマイクはSHUREのSM58という機械で録音しています。
たまに夜遅くなってリビングで録るときはTASCAMのDR-07Xというマイク付きのボイスレコーダーで録ってパソコンで再編集してます。
書き合いもねちょっとねまだまだ私もこなれてないところがあるのでその辺りはまたいつかお話をしたいと思います。
結構ねどう突っ込み入れようかとかどうボケようかとかも結構で何パターンか考えて選んでいるところもあるのでその辺の話もいずれいつかしたいと思います。
実際には目の前にいてリアルタイムで書き合いをしているわけではないので結構つなぎが相変わらず難しいところはありますね。
というわけで残り186日頑張っていきたいと思います。
ゆるいながらも一時ソースをちゃんと確認するメディアクリエーターエコノミーニュースではKaguyaが毎日クリエーターエコノミーに関するニュースをブックマークしていく中で心揺さぶられたものをお届けしています。
毎日の収録配信週に1回の無料のニュースレター2つの媒体で情報発信しています。
ぜひフォロー登録そしてもしエピソードや番組が気に入ってくれたならばSNSなどで拡散して応援してくださるととても嬉しいです。
納豆は引き割り納豆が好きです。
というわけで皆さんもうすぐ週末ですね頑張っていきましょう。
いってらっしゃい。
10:51

コメント

スクロール