#24 人間が話すべきこととは？読み上げAIの可能性を考える

00:01

Podcast総研。この番組は、Podcast Studio Chronicle代表の野村高文と、新しい経済編集長の志田良佑介が、面白い音声コンテンツや音声ビジネスの可能性について、あれこれ語っていく番組です。

こんにちは、野村高文です。

志田良佑介です。

Podcast総研第24回始まりました。よろしくお願いします。

今日のテーマはですね、AI読み上げでいきたいなと思うんですけど。

めちゃめちゃ新しいネタってわけでもないんですけど。

ここ数ヶ月ぐらいの潮流として、結構メディア各社さんが、音声をAIに読ませるポッドキャストを投入し始めてるなって感じがしてるんですよ。

そうなのよ。俺も聞いててびっくりしたわっていうのがありますよ。

たぶん同じ番組だと思うけど。

もともと日経さんとか朝日さんとかはやってたんですけど。

私のフルスのニュースフィックスも、ニュースフィックスニュースレターの週末版か何かで音声読み上げやり始めて。

どんなもんかなと思って聞いたんですけど、結構自然だったんですよね。

そうなのよ。

そうなのじゃないですか、やっぱり。

昔から確かに野村さんが言うように、ポッドキャストでは記憶曖昧ですけどID系のニュースとかで、本当にAIが、私は何とかで、みたいな数字読み上げてるみたいな印象があったの、ニュース読み上げて。

なんだけど、今は?

ニュースフィックスさんのそれを聞いたら、意外と聞けるなっていうか、だいぶ違和感がないなと。

もちろん、間の取り方とかだけなんだなっていう。

それはたぶん入れてますよね、ニュースフィックスさんのあれ。途中でピロンみたいなの入れて。

テンポはつけてますね。

テンポはつけてるものの、それ以外で言うと、下手な人より喋りを聞き取りやすいしね、みたいな。

いや、そうなんですよ。

話になってくるよ、これ。

結構やっぱそれ、私考え込んじゃって。

そうすると本当に、人間が話すべき部分って何なんだろうみたいなことになってくるじゃないですか。

なってくるよ、本当に。

だって例えば、私今朝のニュースレターってやってるわけですよ。

はいはいはい。

ごめんなさい、ニュースレターじゃない、これはニュースコネクト。

ニュースコネクトね。

ニュースコネクトやってるわけですよ。

で、あれってどういうふうに作ってるかっていうと、リサーチするじゃないですか。

で、自分でニュース原稿を書くんですよね。

公開資料とか見ながら自分でニュース原稿を書いて、それをその場のノリも基づいて喋っていって、後で編集して出すっていう感じなんですけど。

そうですね。

なんかわかんないですけど、完璧なニュース原稿があれば、読む必要なくない?みたいなふうにやっぱり思っちゃうわけなんですよね。

03:01

で、今のところ、たとえばしらーさんと私が今こういうふうにやってるような、トーク番組はまだたぶんそこの域には達してないと思うんですよ。

トーク番組をスクリプト通りに喋っても別に面白くないですからね、あんまり。

そうね。

やっぱりその場の勢いとかアドリブとか話があっち行ったりこっち行ったりっていうのも結構必要だと思うんですけど、

なんか一人語りのやつって、すごいなんかあれで大体できるかもしれないなっていうのは思いましたね。

でも究極言うとさ、初音ミクみたいな、あれはAIではないですけれども、ボーカロイド、要は歌を歌わせることができるアイディアじゃないですか。

そうですね。

プログラムさえすれば。だから先々進むと、そういうなんか二人のバラエティトークみたいなのも、

AIとそのテクノロジーで生まれることはなくはないかもしれないですよね。

だから要はお笑いの台本のように放送作家さんがAこれBこれって書いて、

なんでしょう、そのプログラムに突っ込むと一個番組が出来上がってみたいなことって意外とできなくはないかもしれない。

結構ね、これはびっくりしますよね。確かもう今は、ニュースフィックスが採用したのは既存の声だったと思うんですけど、

既にプログラムされている声なんですけど、例えば私の声を相手に読み込ませて、

私が喋っているようにやるっていうのも今できるんですよね。

なるほどね。

そうすると本当に、人間が喋る意味ってなんだろうみたいなふうになっていくじゃないですか。

なっていく。そうだね。本当に自動運転みたいな話だね。

そうなんですよ。今喋りながら思いましたけど、一回それやってみようかな。

ニュースコネクトで一回AIが読んでいる回を作って、バレるのかバレないのかっていうのをやってみたい気がしました。

めっちゃ面白い、それ。やってほしいのはAIが読んでいる回と、ちょっとAI感出して野村さんが読む回。

あえてね。

これどっちどっちみたいなやりたい。

確かに、あえてね。

それやってみよう。今喋りながら思ったけどやってみよう、それ。

そうですね。そういうソフトウェアとかがいっぱいあるってことですよね。

そういうサービスとかプロダクトが出始めてるんですよね。

はいはいはいはいはい。なるほど。

やってみよう、それ。

いや面白いと思いますよ。ニュースコネクト。最悪それでよかったらね、野村さんが本当に喉が枯れちゃった時とかにね、それでできるかもしれないし。

しかも僕らは一応そのAIで読み上げた音声を編集ができるわけじゃないですか。

はいはい。

そこでちょっといじったりすると、AIそのままはそのままでメリットあるんですけど、加工しまくったら本当にクベつくのかなって気持ちもなってくるよね。

06:05

いやそうですよ。でこれ突き詰めた話をすると、例えば亡くなった方の声はもう聞けないんですけど、亡くなった方でその音声データがめっちゃたくさん残っていれば、その人の声を読み込ませて、その人が喋ってるように新しいものを作るっていうのもできちゃうわけですよね。

A6スケさんとか絶対できるわけじゃん。

いやそうですよ。

例えばTBSだと。

データがめちゃめちゃ残ってるわけですよね。

めちゃくちゃ残ってるからね。

そういう世界がやってくるし、もう何年か前の話ですけど、ミソラヒバリさんの歌声が紅白でAIが再現したみたいなのがあったじゃないですか。

新曲みたいになりましたもんね。

その世界が来るな、いよいよ来るなっていう感じはあって。

でもいいな、さっきのしだらさんの私がAI風の演技をしてる回と、本当にAIが読んでる回を2つ並べてみるって、それめっちゃ面白い。

めちゃくちゃ面白くないですか。

それめっちゃ面白い。

めっちゃ面白いと思うよ。

なんかね、あれみたいな感じなんだよな、語学AI、翻訳AIでどこまでの精度かっていうのを測るテストで、相手が本物のネイティブなのか、そのAIが翻訳したものなのかって。

それっていうのはどういうふうにテストするかっていうと、人間がこっち側にいて、ランダムにネイティブの人と機械の翻訳っていうのを順番にやってきてて、どれだったらバレるかみたいなふうにテストするんですよね。

例えばこれはリンゴレスみたいな文章は絶対にバレないんですけど、だんだんと文章が複雑になっていくにつれて、機械の翻訳っていうのはちょっと違和感が生じるじゃないですか。

で、その時にこっち側の人間サイドが、これ機械だなっていうふうにやっぱりバレていくと。

で、それで統一区、難点相当みたいなふうに判定できるらしいんですよ。

AIの精度っていうのを指標化すると、そういうふうに実験するっていう話を聞いたことがあって。

だから多分こういうのもAIもそうなんでしょうね。

ちょっとどこまで演技が上手すぎるとかそういう別の変数もあるのかもしれないですけど。

いやでもね、だから長いと大変かもしれないから、極論オープニングトーク30秒だけを置き換えた回と置き換えてない回とか作ったりしても、実験的に面白いかもしれない。

面白いですね。なんかあまりにも淀みなく喋ってるから逆にこれAIだろうみたいな話もありかもしれないですね。

だから前回の話じゃないけどさ、もう未来はAIが救急車の音とかを後ろに入れてくるかもしれない。むしろ。

自然感出すために。

自然感出すために、Uber Eats来ちゃったりするかもしれない。

AI側で。

そうですね。

入れますか入れませんかみたいな。いやでもね、これだからすごい話だね。

なんかね、思ったのは、やっぱり声ってエンゲージメディアっていう話をしてるじゃないですか。

09:06

はいはいはい。

だから基本的に声で聞いたものって、リスナー側からすると、これ自分がリスナーの時もそうなんですけど、その相手に対して親近感を抱きやすいんですね。

それこそ3回くらい前にあった大沢優里さんのお声っていうのは、もうずっと日本人が何十年も聞いてるから、あの声を聞くとホッとするっていうようなものがあると思うんですけど、

なんかこのそのAIの声っていう手法が確立したら、なんかもう自分のこう何ていうか物理的な時間を超えて、その自分が喋ってるコンテンツを大量生産できるなっていう感じがあるんですよね。

うん、あるよ。

これはなんかね、悪いことにも使えるんじゃないかっていう。

まあね。

まあ洗脳とかね。

はいはいはいはいはい。

なんかまあ洗脳、あの多分洗脳までいくと本当に悪くて、その前は多分マーケティングなんですけど。

うーん、なるほどなるほど。

なんかわかんないですけど、例えばすごいなんかそのサロン主の方がですよ。

はいはいはい。

まあ自分の声をひたすらこうもうなんか24時間、そのなんかサロンメンバーの方にずっと配信し続けるとかもできちゃうわけじゃないですか。

そうね、うん。

まあごめんなさいちょっとサロンっていう例出したら適切じゃなかったかもしれないですけど。

いやいやでもまあまあ。

要はそういうことができちゃうんじゃないですか。

コミュニティの中でビッグブラザーウォッチングいう的なことをずっとこう言うことができると。

うん。

なんですよ。

でまあ例えばねちょっとそういうふうにカルト的なあのこういう集団ってよくそのボスの声をひたすらこうヘッドホンで聞いて。

そうか。

修行をするみたいなこともやってるわけじゃないですか。

うん。

だからねそんなようなことも本当にあの物理のその生身の人間の時間を超えてできちゃうんだなってことを思い始めまして。

そうねだからそれを偽造するとかがまずいのかもねまずね。

あー偽造はまずいでしょうね。

やっぱりそのトップの人がこうおっしゃってたお言葉ですみたいなことは偽造は。

はいはいはいはい。

でもあのそれこそさあの戦争の話になっちゃいますけど。

はい。

大統領が話したねあの映像だって改ざんされる世の中じゃないですか。

いやそうですよ。

偽造される。

ゼレンスキー氏のディープフェイクが出回ってましたからね。

そう出回ったあのぐらいのことになると。

はい。

やっぱりそう考えるとなんかそういうふうに使われたり。

うん。

だからもしかしたらそれがだからまあ最悪洗脳する人が洗脳するのはもうしゃーないというかまあよくないんだけど。

はいはいはい。

あれだけどそのそれのなんていうのかなそれをいろんな人が操れるようになったり。

うんうんうん。

こうスケールできちゃうっていうのが。

そうなんですよそうスケールできちゃうんですよね。

スケールできちゃうってことですよね。

そうなんですよ自分の声のコンテンツが再現なく作れるってことになるんで。

で勝手に動かせるようになってまあで。

いやそうなんですよ。

リーダー側もまあ適当にやっといてよみたいな。

うんうんですです。

俺っぽいこと言わしといてよって。

そう言わしといてよって。

ミノワとかだったら言いそうだもんね。

ははははははは。

任せたよみたいな。

でも確かにななんかねミノワさんの過去の言説とかその本とかを適当に再構成してあの新しいスピーチなんか簡単に作れそうですもんね。

12:00

作れそうだよ本当に。

ですよね。

うんうん。

いやすごい世界だわ。

だから多分ねあの切り抜き動画っていう概念あるじゃないですかYouTubeの。

はいはいはいはいはい。

あれってまあ多分同じような感じで。

うんうんうん。

切り抜き側にもその経済的インセンティブを与えることによって。

はい。

なんか一個の素材をこう再現なく拡散していくみたいな。

うんうん。

モデルだと思うんですよね。

うんうんうん。

で多分同じようにあのもうなんていうかオリジナルの人が稼働しなくても。

はいはいはいはい。

この人の声を使ってなんかその儲けたいみたいな人たちが現れて。

うん。

でこの人が喋ってる風のコンテンツを。

うん。

あのどんどんどんどんもうインターネットミームのように。

うん。

拡散させていってっていう世界は全然できるなと思いますね。

確かに。

うん。

面白いね。

すごくないですかこれこの話。

これすごくなってきたなあ。

うん。

ということでですねあのいつかの回でですねあのニュースコネクトあのAI版があの配信されますんで。

いやーこれめっちゃ楽しみですよ。

ハハハハハ。

うん。

ちょっとやってみたいなと思いました。

ね。

はい。

それをちょっと聞きたいですしちょっと僕も実験してみたいな色々AIは。

そうですね。

なんかだから一回その独り語りでやってみて。

うん。

あのそれが本当によかったらあのしだらさんと私のトーク5分ぐらいを。

やってみるの面白い。

AIでやってみるっていうのはいいかもしれないですね。

うん。

逆に面白いかもしれないしね。

そうですね。

だからその今の段階は違和感がね。

そうですね。

うん。

なんかね。

いい感じ。

あのそうなんですよね。

これちょっとまたどっかの回でやりたいんですけど。

うん。

あの声が違った時に。

はいはいはい。

人はそのどういう印象を抱くかって結構やっぱ私は最近面白いテーマだなと思っていて。

うんうんうん。

まあこれはそのAIとはあの逆なんですけど。

うんうんうん。

最近ねあのちどりお笑い芸人のちどりさんっていう。

はいはいはいはい。

クセスゴ芸人っていうなんかテレビ番組じゃないですか。

うんありますね。

はいはいはいはい。

であれでもう完全にそのVTuberになって。

うん。

あの声も変えて。

はいはいはい。

あの見た目も変えて。

で誰かわかんないんだけどお笑い芸人が漫才やってるっていう映像が出てるんですよ。

面白いね。

うんうんうん。

で片方が女の子の声になってて片方が低い男性のイケボになってて。

うんうんうん。

で男女コンビなのかもしんないし。

うん。

そもそも男男なのかもしんないですけど。

そうね。

うん。

それすらねわかんないんですよ。

はいはいはい。

で漫才がテンポ良くて面白いのはわかるんですけど。

うん。

でも本当に誰がやってるかわかんなくて。

なるほど。

でバレるまで出演できるっていう企画なんですよ。

えー面白い面白い。

うん。

でちょっと私が見た時点ではまだ2回か3回くらいの放送で。

うんうんうん。

まだバレてないんですよね。

あ、わかんないんだまだその動画が誰かが。

そうわかんない。

あのその都度出演者のコメントするような人たちが。

あー。

誰でしょうっていう風に当てるんだけど。

はいはいはい。

当たったらその時点でネタバラシになるんだけど。

なるほどなるほど。

何回か外す。

当たんないんだ。

当たんない外してるんですよ。

うん。

だから結構ねそのじゃあしだらさんと私が完全に声変えて。

うん。

なんかじゃあ女の子の声にして。

確かに。

この会話をしたら果たしてどういう体験になるのかみたいなのはちょっとね。

いや。

やってみたい。

はいはいはい。

だからそれをある意味客観的に聞いてみたいですよね。

聞いてみたいですね。

僕と野村さんのガールズトークをね。

うん。

いや気持ち悪いです。

ガールズトークが成立するのかとかね。

15:01

気持ち悪いですね。

あと逆にわかんないけどさ。

もっと老けた声にすることもできるかもしれない。

あーできますできます。

そうそうそうそう。

40年後を想定したね。

想定したね。

声にすることができますからね。

おさゆりさんモデルみたいな感じでやるのも。

いやそうです。

できますできます。

いやーでもなんかいろいろあるし。

であとはあれだね。

一人で配信してる人が意外と相方作れたりとかしたら面白いね。

この技術。

あーいいですね。

それはありだわ。

アシスタントとか。

あのメインで自分が話すんですけど。

はじめの読み上げとか。

うんうんうん。

でも台本さえ作っときゃいいので。

しだらさんこれは何ですかって質問だけ用意しといて。

AIがそれ読んでくれたら。

はいはいはい。

結構リズムが生まれるから。

でまあAIって言っちゃってもいいと思うんですよ。

はいはいはい。

AIの何々としだらがお送りしますこのポッドキャストですみたいな。

あるかもしれないですけどそういうのが。

しだらさんやっぱ冴えてますね今日。

いやありがとうございます。

さすがテクノロジスト。

いやまあまあそうですよもう。

常に新しいテクノロジストばっかり考えてるんで。

いやーさすがですね。

さすが新しい経済編集省だけあるわ。

いやーそれ面白くないですかなんか。

面白いですね。

でなんかなかなか相方見つけれないよ。

だからコンさんとかやればいいんですよ。

なかなか相方がとか言ってたんで。

この番組でもやっぱポッドキャストはコンビ芸って結構大事みたいな話してますからね。

そうしてるからAIコンビと。

AIコンビか。

なんかねすごいこれも数年前なんですけど。

私の知り合いというかコンサル時代の同僚がですね。

まあそのAI系の会社立ち上げて。

ペッパー君と漫才してM1に出てましたね。

すごいね。

面白い。

そういうことなんですよね。

そういうことですそういうことです。

なんか史上初めてのロボットと人間のコンビっていう。

その時はちょっとしたネット記事になったんですけど。

その知り合いはペッパー君の中の人の立場だったんで。

なるほどなるほどなるほど。

でもやっぱそういうことができちゃったんだなって思いましたね。

できちゃう。

だからいろいろ面白いね確かに。

あのポッドキャストってさ絵が見えないからいろんなそういうちょっと遊びができるところも魅力だな。

話がどんどん広がっていくけど。

生身の体じゃなくてもできるんだよなだからこれっていうのは。

だからそのお笑いの話はめちゃくちゃ面白くて。

例えばだからめちゃくちゃ有名な人と僕らが番組やるけど。

はいはい。

その人は声変えときますでしたら。

うんうんうん。

田森さんと僕と野村さんで番組やってるんですけど。

例えばね。

例えば田森さんは声をちょっと変えてるから本人かわからないっていうコンテンツが作れちゃうわけだよね。

そうですね。

あのボイスチェンジャーなんだけど超大物っていう。

そう超大物。

でそれがボイスチェンジャーだとなんか犯罪の。

なんかそれをだから作りなんていうの。

田森さんじゃないけど例えば野村さんの声にすることもできるわけじゃん。

はいはいはいはい。

では音声スワップができれば。

18:01

うんうんうん。

だから田森さんと俺が野村さんと二人で畳にラジオするとかもできるわけですよ。

そうですね。

噛み切ったとか野村さんに言われる。野村さんの声で噛み切ったって俺が言われるっていう。

何の意味があるのかわからないけど。

いやわからない。

まあできるわけですよね。

でもなんかねそういうことも含めるとめちゃくちゃ見えないからこそなんかいろんな。

でもそれ後でバラしたらめっちゃ面白いとかありそうだし。

そうですね。

なんかね私一回考えたのは企画として。

それこそDMMの神山さんとずっとお付き合いしてくれたのでヒントになったんですけど。

もう顔出しNGの人ばっかり集めた音声番組っていうのを作ったら面白いだろうなっていうのを一回考えたんですよ。

むしろそこにしか出れない人たちだもんね。

出せ出せ出せ。

顔出しNGの人。

テキストも出れるんですけど。

まあまあそうね。

テキストよりも多分臨場感があるから。

そういう方々ばっかり出てくる番組。

いいじゃないですか。

それこそ私の知り合いとかで。

知り合いっていうか取材なんかしたんですけど。

なんかもう若くしてファイヤーしたみたいな人。

稼いじゃった人ね。

送り味方ね。

そうですね。

ファイヤームーブメントの先駆けになったような人とかですね。

あとたまにニュースフィックスやってて受けた企画なんですけど。

覆面座談会ってよくやってて。

例えばインバウンド需要が蒸発してしまって。

その民泊オーナーはどうしてるのかみたいな話とか。

全員顔出しできないんですけど。

なんかそれなりにすごい濃い話が聞けるみたいな。

顎から下だけが写真で写ってるんですね。

出せ出せ。

なんかその腕時計とか。

写真に写ってる類の記事で。

時々やりますね。

やったんですよ結構。

あれは絶対音声向けだなと思って。

まあそうだね。

はい。

で、とはいえ何回か喋ってると声もバレちゃうっていう人いると思うんで。

そう。

そういう本当に顔出しとか正体明かせない人にMCになってもらって。

声を変えてイケボにしてやってくっていう音声は結構いいなって思いました。

そう。そうなのよ。

なんか変なボイスチェンジャーじゃなく変えれるってとこにミソがありそう。

そうですね。

いやーこれ話いいっすね盛り上がるわ。

面白いっすね。

ということでちょっと実験的にやってみようかなと思います。

はい。

今回もお聞きいただきましてありがとうございました。

ちなみにこの番組はしざらの村が音声プラットフォームボイシーで配信している風呂敷タタミニンラジオにもアップロードしていきます。

タタミニンラジオでは音声コンテンツの話だけではなく、ビジネスやキャリアの話もしていますのでぜひお聞きください。

またオーディブルではみんなのメンタールームというリスナーの皆さんのお悩みにお答えしていく番組も配信していますので、合わせてお聞きください。

この番組への感想はハッシュタグポッドキャスト総研。ポッドキャストは英語総研は漢字で投稿いただけると嬉しいです。

それではまたポッドキャストでお会いしましょう。さよなら。

さよなら。

スター

エピソードをシェアする

メッセージを送信

Chronicle

スター

コメント

こちらもおすすめ