00:01
今関わっている動画制作の案件で、音声読み上げを使いたいという話になっています。
作るのはレクチャー系の動画で、ナレーションを機械に読み上げさせるということですね。
機械読み上げを使った動画は、ちょっと怪しい感じもしますし、あまり良くないとは思うんですね。
こうやって私もポッドキャストで喋ってきているので、始めるときに自分が喋るのは恥ずかしいとか、自信がないと思う気持ちはよくわかるんですが、
何度も喋っていれば、だんだん慣れてきて、誰でもそれなりにはなるんじゃないかと思いますし、
やっぱり生身の声には、それぞれの人なりの良さ、個性が出るので、そこに愛着を持ってもらったり、耳なじみになってもらえると強いと思うんですね。
ただ、今回の案件の場合は、複数人で動画を作って、誰が作っても同じようなクオリティになるようにという前提があるんですね。
なので、音声読み上げを使って機械に喋らせようという話になっています。
ボイスチェンジャーで声を変えようかという話も出ていたんですが、結局、元の声での喋り方の癖みたいな部分は出てくるでしょうし、
元の声が違ったら、やっぱり同じようにはならないんじゃないかという話になりました。
そこで、音声読み上げツールに何を使おうかという話です。
企業でやるものなので、全くコストをかけたくないというわけでもないんですが、やっぱりなるべく安い方がいいということで、まずは無料のものを探しています。
で、その動画制作チームの人が見つけてきたのが、音読さんという日本のサービスです。
非常に有名なサービスで、日本では多く使われているようです。
クレジット表記をちゃんとすれば、商用でもビジネス目的でも無料で使えるというところが人気の理由なんでしょうね。
03:00
そして音声読み上げのクオリティも非常に高いと思います。
無料で使える音声読み上げサービスの場合、だいたいどこか別なところが開発した音声読み上げツールのAPIを使っているものが多いんですが、この音読さんはどこのAPIを使っているのかわかりませんでした。
もしかするとオリジナルなのかもしれないです。
音読さんはSEOのためにオウンドメディア的なものをやっていて、例えば音声読み上げソフトのおすすめまとめ、商用利用もできる7000みたいな記事をいっぱい作ってるんですね。
で、この音読さんがどこの音声読み上げのAPIを使っているのかなと検索して調べていると、音読さんが作った記事の無料の音声読み上げサービスが使っているAPIを教えます的な記事が見つかったんですね。
で、その記事には肝心の音読さんはどのAPIを使っているかという記述はありませんでした。なお音読さんは無料で使うと月に5000文字まで読み上げられるという制限があります。
これはファイルに保存するとか関係なく読み上げた文字数の積み上げみたいなので、読み上げる声の種類を変えて読み上げたりとかテストで読み上げさせてもカウントされるので、特に使い始めの時は意外と文字数使っちゃうみたいですね。
今回この音読さんを試している人は200文字くらいのナレーションを喋らせる動画を1本試しに作っているんですが、いろいろテストをしたり原稿をちょっと修正してまた喋り直させたりとかしているうちに1ヶ月の5000文字制限のギリギリまで使ってしまったそうです。
なお音読さんは有料のプランにするとクレジットの表記は不要になります。
クレジットは例えばyoutubeの場合だと説明文のところにこの動画の音声は音読さんを使用していますみたいに入れるか動画の中に文字でナレーション音読さんと入れるなどともかくナレーションが音読さんを使っているとわかるようにすることがクレジットを入れるという意味です。
06:13
有料プランだとそのクレジット表記がいらなくなるというのと文字数の制限も上限が変わります。
月980円のベーシックプランだと月20万字までになります。
ただ音読さんに月980円を払うんだったらもっとおすすめなサービスがあります。
それはアマゾンが提供するアマゾンポリーです。
アマゾンのAWS、アマゾンウェブサービスの中のサービスの一つですね。
アマゾンポリーは初回の利用から12ヶ月間、1年間は月500万字までは無料、それ以降は100万字あたり月4ドルという料金プランになっています。
音声読み上げのクオリティに関しては音読さんとアマゾンポリーを比べてそれほど大差ないかなと思います。
日本語の音声読み上げはやっぱりまだ若干違和感があるのは否めないですね。
アマゾンポリーには空白の長さ、喋らない部分の間ですねをコントロールしたり、辞書を使ってこの単語はこう読むと読み方を指定するとかいうことができます。
いろんな読み方のある漢字の熟語をどう読ませるかとか、アルファベットの略称をどう読ませるかとかそういうことなんだと思います。
アマゾンポリーを使うにはAWSのアカウントが必要なんですが、これがクレジットカードがないと作れないんですね。
企業で使う場合、クレジットカードでの支払いは嫌がる傾向にあるので、ビジネスで使う場合、そこもちょっとネックになってくるかもしれません。
音読さんの場合は銀行振込に対応しているので、そこがさすが日本のサービスというところですね。
ただし銀行振込は年間契約の場合のみですね。
他の音声読み上げのサービスとして、最近見つけたものでロボというサービスがあります。
09:10
海外のサービスなんですが、33の言語で180種類以上の声の種類があります。
日本語にも対応していて、男性が3、女性が2の5種類の声がありました。
個人利用の場合は月に3ファイルまでダウンロードできる無料のプランがあります。
クレジット表記も入れないといけないですね。
音声読み上げのサービスは日本語を喋ってくれないと意味がないので、日本のサービスを探しがちですが、
海外のサービスでも日本語に対応しているものは結構あります。
海外のサービスの方が使い勝手がシンプルだったり、料金が安いものが多いと思います。
ちなみに英語ではテキスト読み上げのことをテキストトゥスピーチという言い方をして
TTSと略すこともあるようです。
逆に音声認識はスピーチトゥテキストでSTTになります。
ということで音声読み上げを無料で行うツールの紹介でした。