無料音声読みあげはFreeTTSでいいかも（第437回）

00:01

ちょっと前に、第435回で音声読み上げについての話をしました。

音読さんというサービスの話をして、この音読さんが音声読み上げのAPIを何を使っているのかがわからないという話をしたところ、

Twitterで教えてくれた人がいました。

その人によると、音読さんはやっぱり音声読み上げのAPIを使っていて、

Google、Amazon、Microsoftの3社のAPIを使っているらしいです。

音読さんで選べるアナウンサーA、B、ロボット、音声アシスタントの声は、Google Text-to-Speech。

水木たくみという名前のついている声は、Amazon Polly。

ナナミケイターは、Microsoft、Azure、Text-to-Speechと3社のAPIを使っているらしいとのことです。

なお、それを教えてくれた人は、PPTuberというPowerPointファイルから動画を作れるサービスを提供している会社の人でした。

PowerPointファイルの発言者ノートのところに読み上げ用の原稿を入れておくと、

動画にするときに、そこの部分のテキストをナレーションとして音声にして動画にしてくれるというサービスです。

このPPTuberでは、音声読み上げにGoogle Text-to-Speechを使っているということでした。

今関わっている動画作成の案件で音声読み上げを使いたいということから色々調べているんですが、

早速音読さんのAPIについての情報を知らせたところ、

担当の人が音読さんで一番いいと思って気に入って使っていた音声は、

Google Text-to-Speechのja-jp-standard-bという声だということが分かりました。

その人によると、色々試した結果、Google Text-to-Speech一択だと。

Amazon Pollyじゃクオリティ的にダメだということでした。

確かにAmazon Pollyの女性の人の声は今一つだと私も思ったんですが、

03:00

男性の方の声は結構いい線いってると私は思います。

ともかく今回の案件の動画制作の担当者が気に入っている声は、

Google Text-to-Speechの音声読み上げだと分かったんですね。

さっきから声が声がと言っていますが、声そのものの好き嫌いというよりは、

読み上げるときのイントネーションなどがいかに自然かという判断基準ですね。

で、今回の案件で音読さんを使うという選択肢もあるんですが、

音読さんは無料で使うには月に5000文字という制限があるのと、

クレジットを必ず入れなければいけないという決まりがあります。

一方でGoogle Text-to-SpeechのAPIを使う場合、毎月100万文字までは無料なんですね。

しかもクレジットを入れる必要もないと。

ということであれば、Google Text-to-SpeechのAPIを使いたいという話になりますよね。

ちなみにGoogle Text-to-Speechの細かい料金体系は、

ウェーブネット音声というAIを使ったより賢い音声読み上げの方が、

毎月100万文字までは無料。100万文字を超えると16ドル。

で、プラス100万文字まで使えると。100万文字あたり16ドルということです。

ウェーブネット音声ではない標準の音声では、毎月400万文字までが無料で、

それ以降は100万文字あたり4ドルといった料金体系になっています。

Google Text-to-Speechはウェブ上でお試しで読み上げさせることはできるんですが、

APIしか提供していなくて、音声ファイルを作るにはAPIを使って、

ある程度プログラム的なものを作らないといけないんですね。

プログラム的なことは私は得意ではないのですが、

調べたところ、ウェブでも使われている技術のPHPやJavaScriptでも使えるということなので、

ネットで色々調べて先人の知恵をお借りすれば何とかなるんじゃないかなと思い、

06:04

じゃあ私の方でちょっとやってみますという話になりました。

で、その後、Google Text-to-Speechで作った音声をファイルとしてダウンロードする方法を色々調べていたら、

あるツールにたどり着きました。

それはFreeTTSというシンプルな名前のサービスなんですが、

Google Text-to-SpeechとAmazon Pollyで音声読み上げができてファイルとして保存できるんですが、

週に6000文字まで無料で使えるんですね。

しかもユーザー登録などしなくても使うことができます。

音読さんの月5000文字に対し週6000文字だとかなり余裕があると思いますし、

ユーザー登録もいらなくてクレジットも入れなくていいと。

色々とややこしい準備をしてGoogle Text-to-SpeechのAPIを使うよりも簡単だし、

文字数制限もこれだけあれば今回の案件では大丈夫なんじゃないかなと思っています。

またこのFreeTTSはMac、Windows用のアプリケーションもあります。

Mac用のFreeTTSはちゃんとMac App Storeでインストールできました。

このアプリ版はちょっと癖があって洗練されてはないんですが、

ブラウザで使うものよりもちょっと機能が豊富です。

アプリ版では声をGoogle、Amazon、Microsoftの3つのAPIから選べます。

ただそれぞれのAPIのすべての声が使えるというわけではないみたいですね。

そしてGoogle Text-to-Speechの声の場合にはピッチとスピードを変更できるなど、

それぞれのAPIが用意しているカスタマイズできる部分に対応しているようです。

アプリ版では音声を再生する聞いてみることができなくてダウンロードするだけというのがちょっと残念ですね。

あとなぜかテキストのペーストができません。

他で用意した読み上げ用の原稿をコピーペーストできないんだったら使い物にならないんじゃないかと思うんですが、

09:03

ドラッグ&ドロップで他のアプリからテキストを持っていくことはできました。

もちろんこのFreeTTSにも有料プランがあって、その有料で使っている人たちのおかげで無料で使えているという構図は音読さんなどと同じですね。

FreeTTSを無料プランで使う人があまりに増えてしまうと、運営側もAPIの使用量が重むと思うので、

無料で使える文字数を減らすとかそういうことになるかもしれないので、

あまりこのツールの存在を広めない方がいいのかなと思ったりもしています。

今回は以上です。

スター

エピソードをシェアする

メッセージを送信

アシカガコウジ

スター

コメント

こちらもおすすめ