NotebookLMの進化
ポッドキャスト界隈を賑わしています、NotebookLM。早速私も使ってみましたです。
いやー、よくできますね、本当にね。笑っちゃいますね。Google、すげーな。
AIもね、やっぱりChatGPTがバーンときて、それあとDeepSeekとかね、さまざまクロードとか。
私が使っているのはPowerPlexityですけど、これはDeepSeekですかね、今ね。
いろいろありますけど、ジェミに結局一番すごいっていう説もね、今浮上してますしね。Googleすごいですね。
いや、本当にね、何かっていうと、テキストなり動画なり音声なりを読み込ませるとですね、
対話形式のポッドキャストっぽいものにしてくれるっていう、そういう機能がついたんですよね。
いや、これがね、びっくりしますよ、自然で。
まあ、もちろんまだアラはありますけれども、こんなもんね、ディープラーニングの一番得意とするところで速攻で直してくると思いますから。
これはね、やっぱ最初に一番驚いたのは、うわ、フィラ入ってるっていうところで。
で、フィラってあれですよね、あのーとかえっとーとか、んーみたいな、なくてもいいやつ。
意味のない言葉ですね。
これって普通、コンピューターで処理する時とかっていうのは除去されそうなもんじゃないですか。
ノイズだもん、ゴミ。これをね、入れてくるんですよね、わざと。
しかも、なんか聞いていて心地いい感じでフィラを入れてくる。
やりますよね、AIね。さすがディープラーニング。
この人間の会話っていうのをめちゃくちゃ学習して、一番いい感じに聞こえるところでフィラはあった方がロボットっぽくないっていう判断なんでしょうね。
実際その通りだと思いますし。
つまりその人が思う人間ぽさって何だろうっていうのをきちんと学習経験、学習して分析して解析してですね、それを実装していると。
これはね、だから時間の問題で、例えばエモい話みたいな、どういう話に人間がエモさを感じるのかなんていうのは、いずれ攻略されるであろうなと。
AIの限界
間違いなくそうでしょうね。
アテンション低いみたいなことも全然できるでしょうし。
なんせ人間の会話なんていうのは、それこそポッドキャストとかね、山ほどラーニングされてるんじゃないかなと思いますけれども。
人気のポッドキャストっていうのが一体なぜ人気なのかっていう分析なんていうのは、非常に巧みにやってくるんだろうなと思うんですね。
いやーすごいですね。
ただ一方、現状あんま使いどころがないなっていうふうにも思っている。
AIだからしょうがないんですけど、文章とかを読み上げるっていうこと自体にはあんまりそんなに大きい意味はなくて、やっぱりその多い量の文章とかデータっていうのを圧縮するっていうんですかね。
わかりやすく短くするみたいなことはすごい上手なんですよ。
ただ、読み上げてそれをありのままに伝えるみたいなことっていうのはまだそんなにうまくできない。
テキストを実際に読ませてみてやったんですよ。
指示が出せるので、その指示の出し方によってはかなりポッドキャストというか会話文の長さみたいなのも長くできるっていうこともわかったんですが、ディテールを拾ってこないんですよね。
で、私の読ませた文章って自分で書いたものですけれども、結構ディテールの部分が大事だったんですけれども、それすっ飛ばすんですよね。
で、その一般的な抽象感みたいなのはめちゃくちゃ上手い。
本当に人間より上手いですね。
なんだけど、別に抽象的にしてくれなくてもいいんだけどなーっていう部分とか全部抽象化しちゃうんですよね。
これはAIが進歩しても多分本質的には変わんないんじゃないですかね。
全ての人にとって分かりやすくという方向をおそらくAIって目指しているので、だから抽象化がうまいんですよね。
数式を作るみたいなことがうまいんだけど、個別のもの、味わい、文体みたいなものは全部取っ払っちゃうんですね。
フィラーはうまく再現するのにね。
おそらくフィラーを作るみたいには文章のディテールっていうのを、どの部分がいいのかっていうのを作り出すってことはおそらくできないんですよね。
今、その界隈で散々言われているので、私もそうだろうなと思うのは、ナレッジ系はすごい難しくなるだろうなと。
つまり、感情が乗っているものであるとか、雑談、取り留めもない、会話の内容がどっち行くか分からないような台本がないようなものは再現が難しいだろうと。
ただ、情報を手短に伝えるっていう、分かりやすく伝えるっていうことに関しては、AI得意だろうっていうふうに言われていて、私もその通りだと思います。
他方、実はナレッジ系の王といえば、日本のポッドキャスター界においては、これはもうコテミラジオですよ。
コテミラジオのユニークさ
ナレッジ界とかじゃなくて、日本のポッドキャスターの王様がコテミラジオなんですけど、そのコテミラジオはナレッジ系の筆頭であります。間違いないですね。
歴史を面白く学ぶっていうことに関して、歴史系のポッドキャスターっていっぱいあるんですよ。
なんで笑ったかっていうと、だけどコテミラジオほど面白いものはないって言おうとして、他のラジオは面白くないって言ってるみたいですよね。
それぞれの良さがあります。ありますね。本当にありますよ。
ただ正直、このAIに置き換えられちゃうだろうなみたいなポッドキャストも私はあるように思います。
が、コテミラジオは置き換わらないですね。絶対。
なんで置き換わらないのかっていうと、ちなみにコテミラジオの作り方って台本を何百ページみたいなのを作って、それを読み上げていくっていう基本的なスタイルなんですよね。
なので、最もAIに食べさせやすい、つまり雑談みたいな台本のないものではない。
何だったら別に本にすることでもできると思いますけれども、あえてやってないんだと思うんですけど、そういうコンテンツですよね。
だからAIに読ませやすいコンテンツだと思うんですけれども、AIに全くできないことをいっぱい含んでいるコンテンツなんですよね。
県庁なのはやっぱり深井さんなりヤンヤンさんなりがですね。
樋口さんはもっとそうです。樋口さんはちなみに台本と関係なく感想とか言ってるんで、あれはAIには全然できないのも嫉妬ですけど、それはそうじゃないですか。
だけど基本的に深井さんとかヤンヤンさんっていうのは台本にあることを読んでるはず。肉付けはするかもしれないけれども、そこに沿ってやってるはず。
削ったりはしてるかもしれないけど、ただ台本の段階でAIの発想を超越してるんですよね。
例えば不動明王はウイルスバスターっていうすごい有名な古典ラジオのフレーズがあるんですよね。これは絶対にAIにはできない。
聞いてわかんないですよね。古典ラジオを聞いてください。不動明王は実はウイルスバスターなんだっていう発想っていうのは古典ラジオにしかできない比喩なんですよね。
そのひねりっていうのはAIにはできない。なぜならAIっていうのはこれまでの人間がやってきたことを上手に真似するっていうことはできるんだけど、古典ラジオしかやってないことを真似るっていうのは相当難しいんですよね。
他にどういう例があるのかな。ちょっと違う話で言うと、例えばルターだっけ。ルターは違うわ。ルソーだ。ジャンジャックルソーですよね。モンテスキューだっけ。どっちかです。
モンテスキューかもしれない。いやルソーだ。ルソーだと思いますけど違ったらごめんなさいね。変態紳士なんですよね。だから露出狂だったりするみたいなそういう話とか出てくるんですけど、それって明らかに関係ないじゃないですか。歴史と法の精神とかと何も関係がないですよね。
ただエピソードとしてはめちゃくちゃ面白くて、だから私の頭の中に残ってるわけです。古典ラジオっていうのはその辺がものすごい巧みなんですよね。うまく人の気を引きそうなエピソードっていうのを散りばめてくる。
これもAIは多分苦手。AIに指示すればできると思います。下ネタを中心に散りばめてみたいなことを指示すればできると思うんですけど、そうすると下ネタ版古典ラジオができちゃうんですよ。おそらく。
古典ラジオみたいにいい出力でいい感じでちょっと息抜きとして入れるみたいなやり方っていうのは相当うまくAIに指示しないとできないでしょうね。できないと思います。
だから古典ラジオは真似できないですね。ていうかそこから見えるのは逆にボン百のコンテンツと古典ラジオの間にどうしてこんなに差があるのかっていうことの説明でもあるんですよね。
おそらく予備校の授業とかよりも古典ラジオって全然面白いのはそういう部分だと思いますね。予備校にも気の利いた先生で面白い授業をしてくれる人はいると思うし、何だったら落語とかだって聞いたら歴史の勉強になるものとかあると思いますけど、違うんですよね。
AIと人間の感性
漫画とかで歴史の漫画を読んでてもあんな古典ラジオほど面白くないんですよ。それは普通だから。で、そういう普通の凡庸なコンテンツは今後AIによって全部駆逐されていくでしょうし、AIによって山ほど作られるでしょうね。
っていうのは思いましたね。ただ、まさにそういう発想の転換みたいなこととか、人間にしかわからないディテールの面白さみたいなのってAI拾えないので、そこのあるものってもうすでに評価されてると思うんですね。
みんな実はそこを聞いてたっていう、そこがAIによって明らかにされちゃいましたね。だって実際古典ラジオ私もずっと聞いてますけど、そんな熱心なリスナーではないですが、忘れちゃいますもんね、その古典の内容自体はね。
あれはやっぱり自分で歴史の本を何十冊とか読んで勉強しているから、血になり肉となるわけであって、古典ラジオだけ聞いたってそんなすぐに歴史の知識なんてできないですよ。ただ、いくらか印象的な描写っていうのはあって、そういうのっていうのはそういうディテールに細部に神が宿っている部分なんですよね。
これはAIにはできない。つまり、AIのポッドキャストはその瞬間耳を埋めることができるけれども、古典ラジオみたいに後々まで印象を残すってことはできない、不可能ですね。
そう思いますよ。有名なとこで、例えばゆる言語学ラジオとか今のやつも聞いてますけど、結局堀本さんと水野さんがケタケタ笑っているところの印象しか残ってないんですよ。そんなこと言うなよ。だけどそうだもん。それがいいんですよ。
で、その部分はでも覚えてるからそういうもんじゃないですかね。人間なんてそういう所詮都度都度の生き物なんでね、と思いましたね。
だからそういう我々がやってる報道みたいな文脈で言っても、一般的なこと、例えば日銀の追加利上げの履歴にどんな意味があるのかみたいなことはめちゃくちゃAIは得意だと思います。
ただ日銀総裁の上田さんがですね、あの表情は何なのかとか、日銀じゃないですけど財務官ってなんでみんなあんな偉そうなのかとか、そういう話はAIにはできないんですね。
そっちのノイズっていうのをいかに拾っていくのか、拾えるのか。自分の経験で言うと、例えば私空データを経験してるんですよね。
間近で見たことがあるんです。見た?見てはいないのか。空データが起きた時のエジプトにいたんですけど、あの時の街の異様な雰囲気とかっていうのは、AIには不可能ですね。言うことができないんですね。
ひょっとしたら上手にモノマネするっていうようなことは後にやるようになってくるのかもしれないですけど、なんていうか、そういう感性が拾うみたいなことができない。
ロボットと人間理解
この間その新聞の見出しで偉いなと思ったのがあったんですけど、知ってる人も結構いるんじゃないですかね。中国の北京でロボットによるハーフマラソンがあったんですよ。
だから二足歩行できるロボットが集まってきて、ワッセワッセとみんなでマラソンをしたんですね。
これがもう今アメリカよりも高い技術を持っているとされる中国のロボット、それだけ二足歩行のロボット業界というものの厚さを示したっていうことで、テレビなんかも結構やってましたし、面白い新聞記事も載ってましたけれども。
その新聞の記事、紙の本の見出しにエホエホって書いてあったんですよ。
あと他にも見出しついたけど、エホエホだけで意味わかんないですからね。ロボットが競争みたいなことでしたけど。
これ明らかにちょっと流行った、今も流行ってるのかしらですけど、エホエホエホエホなんとかかんとかなんとかって伝えなきゃ、エホエホってバカみたいなショート動画で流行ってるあれですよね。
エホエホのエッセンスを巧みに新聞紙面に取り入れてるわけですよ。おそらく読者のQIは変わってないんじゃないかと思いますけど、新聞の読者ってお年寄りなんでね。
あのエホエホに似てる動きをするロボットは確かに、デジタル版の記事には動画がついてるんですけど、北京にいたロボットっていうのもロボットっぽい、ピョコタンピョコタンみたいな動きするやついるじゃないですか。
なんかスムーズに走んないですもんね、みんなね。あれちょっとエホエホ感あったんですよ。っていうような発想のひねり。一回空中でひねってるんですよね。
これってテキストの情報とかその二重情報とかからは作れない。人間の感性がそこに入ってこないと見出し取れないんですよね。
ここはまだ、いずれAIもそういうのできるようになるかもしれないですけど、相当時間かかるんじゃないかな。言語処理的にそこをうまくやるっていうのがかなり難しいんじゃないかなと思いますね。
見出しそうなんですよ。実は見出しってずいぶん前からAIで作れるんですよね。新聞社内にはそういうツールがあって、俺たちも使ってましたけど、結局、綺麗な見出しはすぐ出てくるんですね。
だから、1分1秒争うときとかは本当にスパッスパッと出してくれるんでそれでいいんですけれども、なんか本当は味気ないんですよ。
いわゆる面白い見出しとかにはなんないんですよね。それはおそらくAIにとって変わらない部分ってずっとあるんだろうなっていうね。
石黒教授がロボットに関して言ってましたけど、ロボットの研究をすると人間とは何かがわかってくるみたいなところで、こうやってAIが進歩すると人間のしゃべりにとって重要な部分は何かっていうのがすごい浮き彫りにされる感じがあってめちゃくちゃ面白いですよね。
しかし、せっかくあんなに自然にしゃべってるんでうまく使いたいですけどね。ちょっと使い方を探したいなと思いますね。
ご清聴ありがとうございました。