サマリー
FA-RADIOは、全215話分の音声ファイルと書き起こしを公式に公開した。これにより、リスナーはポッドキャストの内容をより簡単に探しやすくなり、新たな利用法を提案する。また、FA_RADIOは全音声ファイルと書き起こしを公式に公開し、メンバーシップ制度を通じてアクセス情報を提供することを発表した。この新たなアプローチにより、他のAI技術や情報管理ツールとともに、リスナーに新鮮な体験を提供することを目指している。
音声ファイルと書き起こしの公開
明日のファクトリーオートメーションへようこそ。メインパーソナリティの高橋です。
本日はですね、高橋ひとりのお知らせ会になります。
すでにですね、ツイッターとノートには投稿したんですけど、高橋クリスのFA-RADIO 工場自動化ポッドキャストについてですけども、
とりあえず、現状全215話分ですかね、この音声ファイルですね、M4A形式の音声ファイルと、
あとはそれをリッスンで書き起こしたテキストファイルですね、これについてすべて公開をすることにしましたので、その宣伝と報告になります。
で、何でやるんですかっていう話なんですけど、以前の話で、ノートブックLMの話ですね、その科学系ポッドキャストの話で、ノートというテーマに対してノートブックLMすごいねっていう話を少ししたと思うんですけど、
あれからですね、少しノートブックLMを触っててですね、これはなかなかすごいなっていうのをちょっと感じてまして、ノートブックLM何かっていうのをこの回から聞いた人のために説明をすると、
ノートブックLMっていうのはですね、Googleが出しているドキュメントやPDFみたいな資料をWikiみたいな感じでどんどんアップロードしていくと、
その内容に基づいた要約とか質問の応答だとか、アイデア出しとかを、何ですかね、ジェミニーが裏で走ってて、その内容に対して返してくれるっていうAIツールになります。
でですね、このノートブックLMっていうのが音声ファイルに対応してですね、MP3とかを閉じ込むと勝手に文字を故障して、文字越し結構適当なんですけど、
それもうまく保管して、これは多分こういう間違いだなみたいなのを勝手にAI上で保管をしてくれて、我々のチャットの質問に対して答えてくれると。
こういうですね、結構何でも突っ込めるノートブックですね。
今まではノートっていうものは以前の回でもお話ししたんですけど、ノートっていうのは構造化してきれいに取るっていうことが後々のために、その後資産として活用するためにはやはり構造化してきれいに取るっていう必要があったのが、
そのきれいにするっていうのはAIが全部やってくれて、とりあえずそのAIが読みやすい形、人間が読みにくくてもAIが読みやすい形でとりあえずポンポン掘り込んどけばなんとかなるよねみたいな世界観がちょっと見えてきた。
そんなツールになります。私の感じるところでは。
でですね、やっぱりこの音声ファイルと書き起こしに対応したっていうのはやっぱり非常に大きいなと思っていて、
今までこのポッドキャストいいところみたいな感じでググっていくと、聞くまでわからないとか、でも逆にそれがいいんだみたいな、そういう資料だとかブログ記事が結構出てくると思うんです。
これに代表されるように、ポッドキャストっていうのはもともと聞くことが前提で、人の話を聞くのに途中から聞いたりとかできないんで、
基本的に頭から再生していって、例えば30分のポッドキャストがあって25分ぐらいに興味のあることが聞けたとしても、25分間聞かないとそれがわからないというような状況にあったんですけど、
これがですね、情報ソースとして音声ファイルっていうものを取り込んでいくっていう視点で見たときに、
これがですね、このノートブックエレメントみたいなツールが出たことで、音声ファイルそのものが情報ソースとしてより直接的に扱える時代になってきたなというふうに非常に感じました。
例えばですけど、ポッドキャスト、リサの皆様が、あの話どこでしてたっけな、例えば高橋くんFAラジオっていうラジオを聞いたときに、PLCの話は聞きたいけど、PLCって何話で話してるんやろみたいな、
そういうのをね、気になったときに、もうタイトルから見るしかないんですよね。
タイトルにPLCって入ってないと探していくしかないんですけど、今回その音声ファイルを公開することによって、
その音声ファイルをノートブックエレメントみたいなAIツールにとりあえず入れておいて、
そこにですね、高橋クリスのFAラジオの、PLCの回、研究してる回はどれですかっていう質問をするとですね、
これこれこれこれですみたいな感じに返してくれるんですよね。
利用規約と今後の展望
これこれですっていうよりは、こういうことが喋られてますっていうのが一文章でバーってきて、
その横に引用がついていて、その引用をクリックすると、この回の書き起こしのこの部分で喋ってますみたいな、
40行ぐらいの行が出てきたりとか。
そういう感じでですね、ポッドキャストの検索性だったりだとか、
ポッドキャストちょっとまとめて教えてくれたりだとかっていうですね、
ポッドキャストは今まで聞いて、聞いた人が聞いてることをなんとなく解釈してっていう使い方が主だったところだったのが、
少し変わった使い方だとか、そもそもポッドキャストに想定しないような使い方がされるんじゃないかなっていうふうにちょっと感じたので、
そこまでくると、音声データをポッドキャストに上げてる限りは、
リスナーは実はSpotifyとかだけじゃなくて、RSSから勝手に音声データをダウンロードすることってできるんですけど、
例えば僕のポッドキャストだったら、今215話あります。
これをいちいち一個一個ダウンロードするのはめんどくさいし、
一括でダウンロードすることもできるんですけど、ちょっと調べないといけないので、
わざわざ僕みたいなポッドキャストであんまり大手じゃないというか、
有名なポッドキャストじゃないので、そんなところにそんな労力払ってやるかみたいなところがあると思うんですよね。
なので、こういう形で音声ファイルっていうものが今後活用されていくことを考えたときに、
中途半端に一応これでもダウンロードできますよみたいな中途半端な形にするよりは、
やり方はあってこうやったらできるけどっていうのは全部省いて、その最終形態ですよね。
端的に言うとGoogleドライブに今までの高橋くるさんFAラジオの音声ファイル、
全215話分とそれの書き起こしですね、テキストファイルの書き起こし215話分っていうのを
Googleドライブにぶち込んでそれを無料で公開しますっていうことをやります。
なので音声ファイルっていうものはとりあえず上げておくので、
それを自由に使ってもらって構わないですよっていうことになります。
こう考えたのもやっぱり先ほど言った音声の検索性が上がってくるだろうなっていうのもありますし、
我々のラジオが基本的に毎日更新なので、1日1話ずつ増えてくる。
僕ら半年しかやってないのにもう200話超えてるっていう状況なんですよね。
1年やったら300だし、2年やったら700だし、3年やったら1000超えるんで、
そうなったらもう多分何が出てくるかというと、
自分たちでも困るなって思ったんですよね。
なのでやっぱり後々こういう仕組みっていうのは、
僕らのラジオの特性上多分必要だろうと思ったので、
であれば自分たちの中だけでそういうのを用意するんじゃなくて、
アッパーアッパーに全部公開してしまって、
皆さんによく使ってもらうっていうのと、
僕らはこういう仕組みの中だけでそういうのを用意するんじゃなくて、
皆さんによく使ってもらうっていうのと、
僕らが公開してることによって、
何か我々の思いもつかない活用法みたいなものが見れれば、
それはそれで嬉しいなって思うんですよ。
っていうので、もともと隠してるものじゃないんで、音声ファイルって。
なぜならSpotifyから、Spotifyからじゃないな、
RSSのサーバーからダウンロードできるからですね。
書き起こしも別に音声ファイルさえあれば、
それを書き起こす方法っていうのはいくらでもあって、
別に無料でもできるし。
であれば、もうすでにやり方は整っててできるんだから、
やったものをあげといたほうがみんな嬉しくないというふうに考えました。
なのでですね、今回このたかしくんFAラジオっていうポッドキャスト番組は、
公式としてGoogleドライブに音声ファイルと書き起こしファイルっていうのを
ぶち込んだものを公開します。
これの規約としては、
ひえりだったら基本的に何していただいても構いません。
模熟、省略、分析、加工、こういうのはあんまり制限は考えてないので、
基本的に控除、了触に違反しない限りは自由に使ってもらったらなと思います。
また、それで何か作ったものを公開したり共有したりすることも
基本的に問題ないと考えてますので、
これ私への確認は基本不要なので積極的にご活用いただければと思います。
1点ですね、商用利用に関しては、もし検討される場合はお手数ですけど、
私まで一度確認いただけるようお願いします。
商用利用する人はいないと思いますけどね。
一応最初の立ち付けとして決めておくことかなというふうに思ってます。
この音声ファイルを公開したことによって何かがどうなるというのはないと思ってて、
多分ほとんどの人にはほぼ影響ないと思うんですけど、
今がやり時だなと思ったのでやっておくと。
多分この後、ここだといった意味でこれっていうのは自分たち、
私と栗さんの性格からしていい時期で出すっていうのはなかなか苦手なので、
これから音声のちょっと変わりそうだなっていうので、
その前の前から出しとくっていう方向にしようかなというのが我々の結論になります。
ちょっとだけいろいろ試した中で面白いなと思ったこと、
とりあえず今、高橋栗さんFAラジオにはメンバーシップっていうものがあります。
メンバーシップ制度の導入
月1000円でメンバーシップ会員っていうのはなれるんですけど、
その会員の中では我々の今作っているノートブックエレムのノートっていうのがあるんですよね。
ここに書き起こしを全部入れたものと、音声ファイルを全部入れたものを既に用意してます。
これは別に僕らだけじゃなくて音声ファイル公開してるので、
基本的には誰でも作ることができるんですけど、
作るのちょっとめんどくさいんで、ちょっと完成したものを用意してます。
ここへのアクセス権っていうのはメンバーシップの会員には付与しようと思ってます。
本当は全公開しようと思ったんですけど、
どうやらノートブックエレムがリンクを知ってる人全員に公開するっていうのはできないみたいで、
50名までユーザー権限をつけれますよっていうちょっと制約された仕様だったので、
ちょっと残念ながら今回はメンバーシップ会員だけとなります。
そこでそのノートブックにいろいろ質問ができるんですよね。
この情報ソースから何々をしてくださいみたいな。
例えばですけど、登場人物どういう人ですかみたいな。
例えば高橋っていう人間はどういう人間なんですかみたいなことを
このラジオの中から推定してくださいみたいなことも当然できるわけなんです。
そこで高橋がどういうふうな人間と見られてるか、このAIに。
ちょっと読むと、高橋、このポッドキャストのメインパーソナリティの一人。
ファクトリーオートメーション業界のエンジニア。
様々な技術や業界の動向について議論する特定の地域に住んでいることが示唆される。
工場見学からあまり気づきが得られないと感じていたり、
リスト化せずノリで行動するタイプであったり、
物忘れが多く、人の使用費に抵抗がないといった個人的な特性も語られている。
とかこういうラジオでポロッといったことが載るみたいな。
ウィキペディアみたいな。
どこどこの番組でちょろっといったみたいな。
どこどこのインタビューにポロッと答えたみたいな。
そういうのを全部拾われて、それを総括するとこんな感じですみたいにまとめてくれたりだとか。
こういうのって自分たちはなかなか気づきにくいところだなっていうふうにやっぱり思いましたね。
あとはさっき言ったみたいに、僕らのラジオでPLCって何の回でやってますか?みたいな。
今のところ60話分。60話で200分の60なんで3分の1ぐらいにPLCの話を挟んでることが分かったりだとか。
あとはこれにおすすめのネットワーク何ですか?みたいなの聞いたらインターネットIPですよみたいな感じで答えてくるとか。
我々の思想に対して質問をするっていうことができて面白いなというふうに思いました。
これね多分数が結構いるんですよ。
僕らも215個のソースが入ってるんでなかなか面白い回答が出てきてると思うんですけど。
なのでいっぱいとりあえず数を出すポッドキャストちょっと有利だなと思ったのでこれをちょっとやってみたと。
という結論は落ちはないんですけど、
ポッドキャストと音声AI。
音声AIじゃないな。いわゆる今のせせあい関係がなかなかそっちまで足を伸ばしきったっていうのがあるので。
高橋くんですねFAラジオとしてはポッドキャストの検索性だとかそのポッドキャストの今まで取り扱ってこなかった情報ですね。
これを使っていけると面白いなというふうにちょっと思ったので。
そういう一環としてまずは素材がないとどうにもならない。
それもなかなかの数がないとどうにもならないし、ちょっと試しによってハードル下げるのもやっぱり必要だと思うんで。
我々のこのラジオの今回の情報公開っていうのがそれに対してどれだけ影響があるかっていうのは分からないですけど、
マイナスじゃないんでそこまで手間がかかるわけじゃないんでもうやりましょうということで。
高橋くんですねFAラジオは基本的にはこれからもポッドキャストの音声ファイルっていうのは全て公開していく形になります。
AI技術との連携
という今回は今日はご報告でした。
今回Googleドライブのほうに上げていくんですけど、
基本的にRSSにポッドキャストがあるとそこから勝手にスクリプトで音声ファイルをGoogleドライブに突っ込んでくる仕組みになってます。
なので基本的には自動で音声ファイルは更新されていくはずなんですけど、書き起こしのほうはちょっと手動になるので、
週1回できたらサボれば3週間1回とかそういうタイミングでちょっと更新をしていく形になると思います。
書き起こしはできればGoogleドライブじゃなくて、
どこかですね直接検索がかかるようなところに公開したほうがいいんじゃないかっていうのはちょっと思っているので、
それはちょっとクリさんと相談しながら決めていこうかなというふうに思っています。
というわけでですね、
今日の話は高橋クリスのFAラジオ全エピソードの音声ファイルと書き起こしを公開しますというノートの記事のちょっと説明でございました。
皆さんノートブックLMだけじゃなくて、
ジェミニーだとかチャットGDPとかセセア系が昨今Twitterであったりだとかいろんなところでちょっと話題になってますけど、
やはりなかなかですね進化の早い。
なんならチャットGDPできたら2022年ぐらいですよね。
まだ3年弱ぐらいのこの世界の中でどんどん新しいものが出てきてるっていう中で、
このノートブックLMっていうのは一つ違ったアプローチですよね。
チャットじゃない、チャットというか今までチャットGDPっていうのは
世の中をいっぱい学習させましたっていうモデルに対して
みんながだこうだっていうのを聞いていくっていうスタイルでしたけど、
このノートブックLMっていうのは自分の持ってるファイルであったりだとか、
自分はこういう情報の塊をここに置いてますっていうのに対して
いろいろAIを使って説明をするというちょっと今まで変わったアプローチになると思うんですよね。
これを体感をしてみるっていうのも一ついい機会じゃないかと思うので、
もしまだノートブックLM触ったことないよという方いらっしゃいましたら、
ぜひこの機会に触っていただければと思います。
実際Googleアカウントがあれば無料で使えますので、ぜひ触ってみてください。
というわけで、今日は高橋が一人でお送りしました。
それでは皆さん、ご安全に。
17:28
コメント
スクロール