1. まかないラジオ
  2. 40【AIでポッドキャスト編集を..
40【AIでポッドキャスト編集を自動化】2ヶ月の格闘と飲食現場への応用
2026-05-16 1:11:33

40【AIでポッドキャスト編集を自動化】2ヶ月の格闘と飲食現場への応用

今回は、先日出展したポッドキャストウィークエンドの振り返りと、約2ヶ月かけてようやく完成したポッドキャスト編集の自動化ワークフローについて語っています。
会場で感じたのは、ポッドキャスター同士に競争感がなく、ギブの空気が流れる文化祭のような心地よさ。配ったクラフトコーラをきっかけに広がった交流や、隣のブースから生まれた偶然の出会いも印象に残りました。
そこから話は、2ヶ月かけて作り上げたAI編集ワークフローへ。日本語特有の文字起こしの難しさや無音区間でのハルシネーション——見えてきたのは単なる効率化とは少し違う景色でした。
「AIは効率化ツールではなく、自分たちにはできないことをやってくれる存在として捉え直す」という視点から、清藤シェフのいう『ネジを外す』発想へ、さらに厨房録音やシフト管理など飲食現場への応用にまで議論が広がっていきました。
関連リンク
AI駆動開発部の日常(山本がエンジニアの阿部と配信しているもう一つのポッドキャスト)
https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r
枯朽(東京・押上)公式サイト
https://ko-kyu.jp/
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/68dca6d1036795923c406377

感想

まだ感想はありません。最初の1件を書きましょう!

サマリー

今回の「まかないラジオ」では、ポッドキャストウィークエンドへの参加体験と、約2ヶ月かけて完成したポッドキャスト編集の自動化ワークフローについて語られています。イベントでは、ポッドキャスター同士の競争感のなさや、ギブアンドテイクの文化、クラフトコーラをきっかけにした交流などが印象的でした。続いて、2ヶ月にわたるAI編集ワークフロー構築の苦労話へ。日本語の文字起こしの難しさや無音区間でのAIの誤作動(ハルシネーション)といった課題を乗り越え、Adobe Premiere Proで編集可能な形式で出力できるシステムが完成しました。この自動化により、1時間の音源編集にかかる時間が約2時間から10分に短縮されました。さらに、この技術は概要欄やタイトルの自動生成、将来的には配信スケジュールの自動設定まで可能にするポテンシャルを秘めています。AIを単なる効率化ツールではなく、「自分たちにはできないことをやってくれる存在」として捉え直す視点が強調され、厨房での録音やシフト管理といった飲食現場への応用についても議論が展開されました。特に、AIによるデータ分析が、人件費率の最適化や需要予測、さらには店舗横断での分析にまで活用できる可能性が示唆されました。この自動化ワークフローは、ポッドキャスト編集だけでなく、飲食業界における業務効率化や新たな価値創造への道を開くものとして期待されています。

ポッドキャストウィークエンドの振り返り
こんにちは、まかないラジオへようこそ。このポッドキャストは、東京押し上げにあるレストラン呼吸のオーナーシェフキョウフジと、オンライン料理教室シェフレピノヤモトが、料理の世界で日々感じた気づきや発見を、まかないを囲むように緩く語り合う番組です。
はい、じゃあよろしくお願いします。
はい、よろしくお願いします。
はい、お願いします。
はい、じゃあ今日は、まずね、ポッドキャストウィーケンド行ってきましたよっていうところと、このポッドキャストの編集のポッドキャスト運営にまつわるところみたいな文脈で、ポッドキャスト編集の自動化みたいなのをずっとセコセコやってたんですけれども、
それがちょうど完成したので、その辺の話とかができればいいかなと思ってますので、よろしくお願いします。
はい、よろしくお願いします。
よろしくお願いします。
まず、ポッドキャストウィーケンドですね。お疲れ様でした。
はい、お疲れ様でした。
お疲れ様でした。結構大変でしたね。
大変でしたね。
まあ、池ちゃんさんお疲れ様でしたっていう気持ちがね。
確かに。
今回は仕込み等々ね、結構池ちゃんさんにお任せした部分が多かったので、ありがとうございましたっていうところと、楽しかったですね。忙しかったですけど。
本当に楽しかったですね。僕も結構ポッドキャスターの人達との色々話とかできたんで、聞いてくれてるよっていう人もいたりもしたので、結構良かったなというような感じでしたね。
良かったですね。初めてじゃないですけど、実感はきましたよね。ポッドキャスターやってるんだ、私たちはみたいな感じを。
確かに確かに。
あと、ポッドキャスターコミュニティの心地よさ、もう体感できたね。
確かに確かに。
結構熱かった。途中でね、クラフトコーラをポッドキャスターの人達に配るみたいな。
そっからちょっと仲良くなって、何回もキッチンの方に食べに来てくれたりとか、そういう方々とかもいらっしゃって、すごい優しいなというか。
なんか良いなという気がしましたね。
確かにな。
ちゃんと、なんだろうな、ちょっとした田舎っぽい感じじゃないけど、渡しても渡しても、ステッカーくれたりとか、ギブするだけじゃなくて、
ブツブツ交換。
みたいな、そんな感じも面白かったなって。
なんか確かに、なんて言うでしょうね、基本的に皆さん、ポッドキャストで喋ってるので、やっぱり会話がまずお上手だっていうのが一つあるのと、
あとやっぱり、YouTubeとかインスタとかと違って、あんまり競争感がないから、ポッドキャスト自体に。
ギラギラしてないみたいなのがあるじゃないですか。
確かにギラギラしてなかったね。
みんな、そんなやってるんですねって言って、お互いその場でフォローし合うみたいな。
聞いてみます?みたいな。
むしろ、出展して近くのブースだからって聞いてくれてた人とかもいて。
なんかそういう、仲良くなろうとする人が多いのかな。仲良くなりたいというか、としてくれる人が多くて。
こっちもそうだし、みたいな。確かに競争感はなかったかもしれない。
それが一番の心地よいポイントですよね。
あとジャンルが違うのも結構あるよね。
ポッドキャストっていうのはカテゴリーの枠なんだけど、職って言っても全然違うかったりとか。
職じゃないカテゴリーの人たちもいっぱいいたりとかして。
その中で結構話ができるというか、ある意味フラットに関われるってあんまりないよね、このご時世。
自分と同属性の人と話しやすい環境だからね。
またやりたいですね。来年も参加できるといいなっていう。
本当にそう思います。周りのブースの人も面白かったのが、精神科医さんとデザイナーさん2人でやってるとか。
あとデザイナーさんと漫画家さんが一緒にやってるとかもあったりとか。
あとは人生百科典っていうポッドキャストをしてる方が、
その人は百科典のように20代30代の人生が並んで聞けるみたいな感じのっていう見合いで人生百科典。
なんか機を出てほしいですね。
俺も出てほしいって言われてるけど。
出ましょう。いろんなところのやつに参加させてもらいましょう。
せっかくなんで。
結構そういう面白い。みんないい人たちやと。
それが何よりです。
あとあれですよね。
カナエラジオを聞いてくださっている方は知っているハットリさんとかね、一言ラジオ。
ハットリさん、北海道のハートの釣りのシェフとかもわざわざ東京まで来ていたので、久々に再会して楽しい時間を過ごしましたね。
ハットリさんはいつもうちのブースで何かを食べてましたね。
本当に破産するんじゃないかなってくらい食べてましたね。
ありがたいんですけど、ちょっと心配になるくらいいっぱい食べてくれました。
だって最後の方とか現金もうなくなってて、現金ないからって言って隣の人に払ってもらってペイペイで送金したりしてました。
本当にありがたいですね。
あとフード関係で言うと、ノーフードラジオさん、面白そうやったよね。
農学、何て書いてたっけ、農科みたいな。
農学美術館。
ガチ勉みたいな。
農学ことガチ勉。
書いてましたよね。
面白そう。
あれはかなり興味ありますね。
今特にポッドキャスト抜きにしてもすごく興味がある。
みたいな感じで文化祭感があってよかったですね。
文化祭でした、もう。
やっぱり結構、去年というか前の回、4年前とかに開催された時も出てて、その繋がりでみたいな感じで知り合いが、3年前かなちょっと忘れちゃったけど、そんな感じで。
継続して出展するとそこで仲良い人ができてみたいなのがあるみたいで。
なので続けたいなと思いました。
AIのラジオの方、聞いてくれてる人もいたよ。
すごい。
工場の生産ラインを自動化する話しかしないポッドキャストをしてる人が。
ニッチすぎる人に刺さってるんですよ、あれを。
ヤバいな、それ。
面白いよね。
面白い。ちょっと次回が何年後になるのかちょっと分かんないですけど。
分かんないけど。
次回はなるべく僕も他のブースをいっぱい回れるように頑張ろう。
2日で変えたら良かった。2日両方出展して、キヨと俺のポジションを変わるみたいなのにしたら良かったのかもね。
確かに確かに。そしたらお互いいろんな方に挨拶したりとか、外回ってね。
あとは普通にブースだけ出展にするとかも一つだけど。
そんな感じで。
確かに。
楽しかったなという感じでした。来てくださった方もね。ありがとうございました。
ありがとうございました。
ポッドキャスト編集の自動化ワークフロー
ちょっとそれにまつわる話というか、ポッドキャスト。
あの時から多分登録者、あの日と翌日ぐらいで30人ぐらい増えてたよね。
それは嬉しい。
だから結構なんかみんな登録してくれたんだなというふうに思ってて。
ちょうどね、ちょっとだけ話変わるんですけれども、ようやく2ヶ月ぐらいずっとやっててようやくできたポッドキャスト編集自動化が完成しました。
お疲れ様でした。ありがとうございます。
お疲れ様でした。
やってくれることは非常にシンプルで、今ね、この全キャスターっていう、これポッドキャスターの方も多分聞いてくれてる方もいらっしゃると思うので、
おすすめとして全キャスターっていうやつで僕たち収録してるじゃないですか。
で、これだと僕とキヨの音声が分離してトラックで吐き出されるじゃないですか。
はいはい。
だから僕の方でちょっと騒音しててキヨが喋ってるみたいなとか、くしゃみしちゃっててけど相方が喋ってるみたいな時にミュートにできるから、
ミュートにしたりその部分カットして、だからもう喋ってる人だけの音声にできるみたいなのが結構便利だったなと思って。
はいはい。
で、まあそういう、片方が喋ってて片方がノイズがあるとか喋ってる、発話してないみたいなものを勝手にカットしてくれて。
うんうんうんうん。
で、お互いが喋ってないところもまるっとカットしてくれて。
うん。
で、あとはなんかたまに僕が噛む、これ言い直しますみたいなとかを検知して、
はいはい。
AIがこう推論してくれて、カット提案をしてくれて、承認するとその部分をカットしてくれる。
そうそうそう。
すごい。
そうなんですよ。
へー。
っていうところが一連のフローとしてできるっていうのと、あとこれはなんかすごい発見だったんですけど、
はい。
結構でかいことが一個仕組みとしてあって、
はい。
最終的にAI音声とか、まあAIの動画とかもそうですけど、編集した後ってそのサービス内で編集する、もしくは何も編集できないみたいなのが結構多い。
だからAIの出力が精度が高くないともう詰むみたいな。
うんうんうんうんうん。
なんですけど、今回作ったのは、今普段僕たちはAdobe Premiere Proっていう動画編集ソフトで編集してるんですけど、
はいはいはい。
それで読み込めるっていう。
あ、へー。
そう。なんで、この編集、AIフローで編集したやつを読み込んでカットされたタイムラインの状態で追加編集ができるみたいな。
だからここ切りすぎだなとかあったらちょっとピット補正したりとか。
そう、普段のツールでできちゃうっていう。
それめっちゃでかいっすね。
結構でかいよね、これ。
うんうんうんうん。
うん。
あ、それは便利だ。
どうにでもなるっすもんね。
そうそうそうそう。だからカットの部分とか、一番初めの食材の下処理みたいなのをやってくれて、
うんうんうんうんうん。
で、その後音声差し替えたりとか、なんかそういうの。
まあ自由に、普段自分が使ってるツールでできる。
えーすごい。最後、最後自分でできるならなんか安心っすもんね。
そうそうそうそう。なんか結構AI編集ツールって、なんか最後結局そのサービスに全部なんかツールごと乗り換えないといけないみたいななんか。
うんうんうんうんうん。
とか、なんかなんだったらいじれないとか。
えー面白い。それはなんかずっと前ヤモンさんがなんか言ってた、そのAIをこう人としてというか部下として使うみたいなところの感覚を今すごい思ったんですけど。
やっぱりなんか、うん、すごいあのーある程度何でもやってくれる部下があらかたこう仕上げてくれて、最後確認をして、
あらがあればちゃんとこっちで最後手直しもできるっていう状態がなんか素晴らしいっすね。
うんうんうんうん。
使いやすそう。
そう、っていうのをね、一応できて、もうマジで苦労した。
マジで苦労した。マジであの、ちょっとこう、今日はそういう話でいいかな。苦労した話をしていいかな。
苦労した話をね、ぜひ聞かせていただきてます。
ちなみにその苦労した末に、今まで池ちゃんさんが例えば編集にどのくらいかけていたのがどのくらいに縮まったんですか?
あ、えっとね、まあワークフローを動かすのは結構処理が多段に入ってるから、
まあ実際30分とかずっとPCを動かしてるみたいな状態なんだけど、まあほぼ放置なんで、
まあそれは一旦抜きにして、まあ単純な作業時間みたいなところだけで言うと、
あのー、まあ例えば1時間の編集、1時間の音源があって、それを編集しますので、
それの倍ぐらい時間をかけてた?まあそれは音声も聞かないといけないしとかいろいろあって、
まあ1時間だったら大体2時間、まあ大体だから収録の尺の倍かかってたのが10分になりました。
素晴らしい、素晴らしい。
いやーこういうことにね、使うべきですよね、ほんとに。
あーすごい、いやーお疲れ様でした、そして池ちゃんさんおめでとうございます。
しかもこれ新しい副次的な効果があってですね、
実はまかないラジオの概要欄ってほぼほぼ叩き台をAIが作ってくれて、
最後微調整をするみたいな感じのフローになってるんですけど、
それを今までって、完成音源をGoogleのノートブックLMってやつに入れると、
その音源を文字起こししてくるんですよね。
なんですけど、それはなんか和写分離とかそういうのはせずに、
一括で音声でバンって文字起こしされるし、
まあ精度もめちゃめちゃ高いかと言われるとって感じだったんですよ。
それがこの2トラック音声で、しかも時系列しっかりしてて、
しかも文字起こし精度もそこそこ高いみたいなので、
吐き出されるようにしたんで、それをAIに食べさせれるから、
そっちの文章生成の精度とかも上がって。
あ、すごい。
しかもこれ何がすごいかっていうと、
そうすると次にワークフローに追加で、
概要欄とタイトルの推論するステップを追加すれば、
わざわざクロードとかChatGPTにコピペするとかそんな作業も不要で、
もう音声ファイルと概要欄とタイトルと全部できちゃうみたいなところまでいける。
だからこの間の作業、コピペ作業が一切不要になるっていう。
やば。
そう。で、これ次にそのまま、
例えばこっちが手直しするのを学習させていくじゃん。
で、ほぼだいたい10中8区いいタイトルとか概要欄出してくれるように
っていう精度まで上がったとしたら、
これ次にできることとすれば、
自動で配信のスケジュールをセットするところまでやってくれるように。
全部できるんだ。
そう。
すげえ。
全部つなげられる下地ができましたっていう状態。
でも本当にPodcast Weekendのイベントの会場でもちょっとAIの関係の方とお話をしたりしてましたけど、
やっぱりこういう話を旗からパッと軽く聞いただけたらやっぱり
AIって便利ですねとかAIってここまでできるなんてみたいな感じでやっぱり思われがちじゃないですか。
確かに全部AIのおかげみたいな。
楽にって思うけどやっぱりそれを開発するためにどれだけの苦労があったのかみたいな話もちょっと聞きたいし、
それがわかると皆さん楽してるわけじゃないっていう後ろめたさがなくなるだけでAIを使う人増えそうな気がする。
確かにね確かにね。
なんかその楽な方法、効率化の方向ともう一つあると思ってて、
最近のAIの精度までいくと自分じゃ出せないクオリティになるんですよ。
自分が出したい雰囲気とかそういうのはちゃんと注入していけばいい話。
作家性の部分は注入していくっていうところがあると思うんですけど、
出せないクオリティ出せるからやっぱ前も何回も言ってきてるけど、
自分じゃできなかったことをやるツールとして捉え直した方がいいフェーズに来てるなっていうのはまず前提としてあるなって思っていて、
まずそこが一つですよね。
効率化ツールじゃなくて、物としてすごいものが出来上がるところまで修練させていくと、
もうなんかAI使ってすごいですよねとかそういう話じゃなくて、
単純に成果物がすごいものになってるみたいな状態になるから、
そこを目指す、AIを使ったサービスを作るものとしてはそこを目指さないとなっていうのは最近思うところ。
基本的にはみんな効率化、僕も含めですけど、効率化のために今やっているものを楽にするために使うっていう認識を改めてという話ですね。
自分じゃできてないことでAIができそうなところって何なんだろうっていうところを問い直すみたいなのは結構必要なステップかなと思うし、
AI活用の新たな視点と飲食現場への応用
例えば今シフト管理とかそのあたりのAIのサービスとかを作ってるじゃないですか、僕が。
そうすると時間単位の人件比率が出せるようになったりとかするんですよね。
だから例えば1年通して運用したら絶対に毎週月曜日の15時から16時って人件比率が80%超えてて、
ここは仕込みに使っているのか、何なのかみたいな。仕込みもしてない時間だったらそれって何なんだろうみたいな。
あとは天気とか人じゃ取れない情報まで収集してくれるから、天気もそうだし近くでどんなイベントがあったかもそうだし、
なんか今日はやけに人が来るなみたいなのがあったりして、それは近くでこういう祭りがあったからだろうみたいな推論までやってくれて、
それを保持しておいてくれると、来週発注するときにこの祭りあったときに前回こんくらい売上番号って上がって、
なんか欠品して売上のロスがあったから多めに仕込んだり仕入れておいた方がいいんじゃないですかっていう提案までできるみたいな。
なるほどね。それはなかなか人にはね、特にうちみたいな小さなお店でやってる場合、頑張ってできる範囲をちょっと超えてる。
そうそう、頑張ってできる範囲を超えてる。頑張ってできるとかそういう話じゃないみたいな。
そうですね。人知を超えた。
そうそう。あとかつ、これは将来構想で考えてるけど、店舗横断で見れる。だから押し上げ付近の店舗全体が売り上げ上がったんだったら、それは何かあっただろうみたいな。
っていうのを、店舗ごとのデータはもちろん個別データなんで、個人情報にあたるのでマスキングするんだけど、こういう傾向みたいなところはちゃんとジャッジして推論してっていう風にすると、
個展でもいわゆる大きい飲食グループみたいなのと同じような強い分析の動きができてくるみたいな。
うんうんうん。やばいな。確かにわかんないですもんね。たとえばうちはまだ予約のだけのお店ですけど、そうじゃないお店にとって本当にそういうちっちゃなことで売り上げってめちゃくちゃ変わるじゃないですか。
そうそうそう。
だし、呼吸も要するにハイエンドのレストランっていうカテゴリーの枠には入ってて、高価格帯の。で別に東京単位で見たときに、たとえば単価が2万以上のお店の傾向として、今月こういう売り上げだった、それが自流の特性、季節性によるものなのか、単にうちだけ低いのかみたいな。
確かに関係ないですもんね。
そうそうそう。
なるほどなるほど。
じゃあ全体下がってるんだみたいな。じゃあ季節性の方かみたいな。けど全体は上がってるのにうちだけ下がってるんだったらなんか改善しないといけないかもみたいな。
うんうんうん。
それが見れるだけでちょっと怖い。
観光地近かったらやっぱ海外のお客さんがどのくらい動いててとかでも全然違いますしね。それでやっぱり地域ごとにここの地域は上がってるみたいなのがわかれば。
うんうん。
じゃあその告知の先を海外向けにちょっと動かしていこうとかできますもんね。
そうそうそう。海外のお客さん増えてる最近みたいな全体的に高単価の店はみたいな風になってけどうちだけ増えてないなみたいな。そこ機械損失なんかあるなみたいな。
あー確かに。
うん。
ゲー。
みたいな人知を超えた人にはできないことっていうのがやっぱできるようになる。で、そういうところは目指したいなみたいなのが。
AI開発の苦労と日本語特有の課題
ちょっと話し添えちゃったんだけど。AIでそういう自動化サービスとか自動化するってどれくらいしんどいんだろうみたいなところの話をできたらと思ってて。
AIサービスを作る上で結構難しいポイントで、AIに自由にさせるコーデックスとかChatGPTとかクロードコードとかっていうのがあるんですけど、それに今の時流っていうのはスキルっていうのを定義して、いわゆるこういうステップでやっていってくださいみたいな。
うんうん。
ずっと、しかも永遠と動かし続けて2、3ヶ月やってた。
はいはいはい。
気を置いてたけどあの、鶴井村でね。
あれですね。
永遠と、寝る前に何かぶつぶつ言って。
永遠にね。
起きた後歯磨く前に。
うん。あれはね、慣れてないっていうか知らない人からしたら異様な光景なんですよ、皆さん。
あの、本当に寝る前に部屋真っ暗にして、同じ部屋だったんでね、3人ぐらいがね。
おやすみなさい、明日もよろしくお願いします、みたいな感じで僕らでね、言って寝ようとしたらヤモトさんはその後にパソコンに向かってそのまま作業を続けてくださいって言ってから寝るっていうね。
で、起きてまたすぐ声掛けをしてるっていう。
ちょっと異様な光景でしたけど、まあそうやってフル回転させてるってことですね。
ずっと動かすっていう。だからMacにアンフェタミンとかカフェインっていうアプリがあって、そういうのを入れて、パソコンを閉じても落ちないようにしてたりとか。
AIが動き続けるように。
やばいですね、まじで。
まあみたいなこと、それをずっと続けて永遠と。ちなみにあれやってたのは、つり村のときは全然違うことをやってたんですけど、それを3並列とかいろんなプロジェクトでやってるみたいな、3、4並列とかでやってるみたいな感じで、ずっとやって。
それで2ヶ月とか3ヶ月くらいかけて、わりとしかも夜も3時、4時とかまで自分も起きててみたいな感じで。
自分も起きてやってるんですね。
結局寝る前に大きいタスクにしたいんよね。あと続けるだけみたいな状態にしたくて。それを作りきれるまでは寝れないみたいな自分のルールが。
人じゃないですか。ここまで教えてから後任せないと結局めんどくさいことが起こるから。
あと時間もうちょっと無駄だなみたいな。
あとはもう単純作業を進めるだけですよってところまでは自分も一緒にやっていくみたいな。
そうそうそう。計画立てるところが後ろ倒しになると寝る時間が削れていくみたいな。
だからやっぱりAIが何でもかんでも楽にやってくれるわけじゃないっていうのはそういうところでも少しわかると思いますね。
その上で今回ちょっと面白い。多分AI興味ない人でも面白いのかなっていう。今回のポッドキャストを編集するワークフローの仕組み上結構面白い。すごい音声文字起こしというものに対して詳しくなったんやけどこれを機に。
まずASRっていうLLMをベースにした文字起こしのモデルがあって文字起こし用のモデルみたいなのがあって、それをするとワード単位のタイムスタンプみたいなのが生成されたりするんだよね。
ワード単位っていうのは例えば英語だとI thinkみたいなI thinkなんちゃらみたいなを言ったときに、Iとthinkとなんちゃらみたいなワード単位でその文字がどの時間に当てはまってるかっていうのを推論してくれて、一緒に推論してくれて文字起こしと一緒にこのタイムスタンプ何時何分何秒何点何秒みたいなところまでに
この文字が入ってるみたいなことを一緒に推論してくれるっていうのがあって。
あんまり今理解が追いついてないですけど。
1.1秒のタイミングでハローって言ってるみたいな。このタイムスタンプが取れないと何点何秒から何点何秒の間をカットするっていう推論がAIはできないわけですね。
その話ですね。
その話があって、これが落とし穴がありまして、ワードレベルのタイムスタンプって日本語とすこぶる相性が悪くてですね。
なるほど。
日本語ってワード単位って英語だとI thinkとかっていう単語単位なんですけど、日本語ってわ、た、し、わって一個一個の意味のない音がワードレベルのタイムスタンプになるんだよね。
うんうんうん。
だから丸とかもそういうのも全部いろいろになるから。これダメだと思って文章レベルのタイムスタンプに変えてまずっていう、これ一個大きな落とし穴があってですね。
文章レベル。
文章レベルのタイムスタンプってそんな精度が高くないというか、めっちゃ高いわけじゃないし、文章の途中で切りたいみたいなことがあるわけじゃん。
例えばおはよう、あ、もう一回言い直します、おはようございますみたいなのを一つの文章で文字起こしされてたら、それ全部をカットするのかどうかみたいなだけの話になるんで。
あんまり使えないから、一回それでざっくりしたタイムスタンプと文字起こしを出して、日本語のトークナイザーっていうのがあって、発音レベル、だから一回おはようございます私はみたいなのがあったとしたら、
おはようございます私はを全部カナに変換する、音に変換して、その音が何秒に発話してるのかみたいなのを抽出するみたいな、そういう処理を挟む。
その時結構面白くて、例えば、その時にAI駆動開発部の日常っていう、ポッドキャストは別でやってるじゃん。このAI駆動開発部の日常の駆動の駆がさ、中国の漢字に文字起こしされたりするのよ、たまに。
そうするとその日本語のトークナイザーって、そんな日本語ありませんみたいな感じで、エラーで落ちる。だから、中国漢字を日本語の漢字に変換するっていう、また違うライブラリがあって。
それで変換するみたいなことを、間でちょっとこうフォールバック的に挟んだりするっていう。
ヤバい、しかも。
しかもこういう風に今話してるのの間に絶対に無音の区間っていうのは存在するじゃんか。無音の区間ってLLMがハルシネーション起こしやすいんだよね。
ハルシネーションって嘘つくというか、こんなこと言ってないのに言っちゃってるみたいな。ポッドキャストって言ってないのに無音区間なのにポッドキャストって言ってるみたいなのがあって。
それですべてがおかしくなるから、どこが発話かどうかを見極めて、発話以外の場所を切って、切り詰めしていくみたいな作業をその前にした準備時点でして。
だからもう超隙間もなくバーって喋り続けるみたいな音源を、しかも俺ら今1時間とかで喋るじゃん。1時間とか入れる文字起こしのやつってなると選択肢かなり限られるよね。
だからチャンク分けって言って、3分以内で、しかも文章としてまともになり立つ単位で切り分けていくっていう処理をその前段で入れて。
だから今俺が作ったポッドキャストの編集ワークフローだったら10時間でも何でもできるようになってるんだけど、だからチャンク分けしてくれるかなと。
3分以内の1つの文章の塊として成り立たせるための切り分け方。発話を1個1個区切るんだけど、区切り方も変な時があるから。
これ1個の発話の島ごとの間に0.1ミリセックとか、いわゆる0.1秒とか、0.1秒とかの100ミリセックとか、100ミリセックとか以内で繋がってるんだったらそれは1つの文章として見直しましょうみたいなルールを一個一個作っていって。
そのルールにのっとって文章を繋げていって。で、3分以内の島にしていくみたいなことをして。
で、それもまた2分半以内だと、5分以内に始めしてたんだけど、5分以内だと文字起こしの精度がすこぼり低くなるっていうことが分かって、だから3分って言ったんだけど、本当は2分32秒にしてるのかな。
2分32秒の島にして、一番文字起こし精度が高まるかつ文字起こししやすい単位にして、分割してみたいなそういう細かい処理を一個一個積み上げていくみたいな。
3ヶ月かかったって言ってましたけど、3ヶ月でできるんだってすごい今逆に思ったのと、
なんか、そのポッドキャスト自動化アプリっていうのだけで起業する人ぐらいのことやってるように僕からは見える。
自分のポッドキャストの編集を自動化させたいっていう情熱のレベルを超えてるようにしか見えない。
これなんかいろんな人に使ってほしいですけどね。
まあ確かにね。いろんな人に使ってもらうには、俺の中ではちょっと汎用ルールが若干足りない気がしてて、
使いたい人が、例えば月月1万円でいいから使いたいですみたいな人がいるんだったら、ちょっと頑張って製品化とか目指したいなと思うけど、
今のレベルだとうちのユースケースオンリーっていうか、もうちょっと幅広ではあるけど、
文字起こしをするっていうところまでのフローっていうのは、割と多分他の人たちでも作れると思うんですけど、
使えるような感じにしてて、けどそれを実際の編集みたいなところになると、うちだとフィラーワードはちょっと残したいよねみたいなところがある。
フィラーワードっていうのは、うんとかえーとかあのーとかっていうのも、
人の発話だし、その人の喋り方だから、その癖っていうのは残したいなっていうのがあったんで、フィラーワードを消すようなことはしてないんですよね、みたいな。
けど消したい人もいるじゃないですか、例えば。
そうですね。
あとノイズキャンセリング、うちだと普通ぐらいのノイズキャンセリングを入れてるんですけど、一番きついノイズキャンセリングすると、今のうんうんうんとか、
合図地も消せるぐらいのノイズキャンセリングができたりして、うちだとシュアーのマイク使ってるから、そんなにめっちゃノイズが入ってくる前提じゃないから、
それでいいかなって思うんですけど、それはモデルを変えればいいだけなんですけど、それをその人の設定にした方がいいのかみたいなことを考えると、
それを設定するためのパネルが必要だよねみたいなとか、そういう話になってきて。
またそこから何段階も大変になってくるんですね、いろんなパターンに。設定できるようにするっていう無限の作業が必要なんですね。
そうそうそう。だから正直ロジックっていうところはある程度作り込んでるんだけど、
人が誰でも使えるか、MacBookとか使ってる人だとターミナルっていうのアプリ見たことある人、黒い画面のエンジニアがされると、そっから実行することしかしてないよ今。
そっから実行して勝手に音声が仕上がってくるみたいな、だからそのユーザーインターフェース作らないといけないとかもあるんで、どっちかというとこう
めっちゃ今全然、みんな使ったらいいじゃないですかぐらいの気持ちで言ったんですけど、なるほどなって思いました。
そう、なんかいろいろあるっていう。
普段何気なく使ってるアプリとかでも何でもそうですけど、誰でも使えるっていうか、自分の好きな設定に変えていけるっていうことはそれだけですごいことなんですね。
全然知らない、全然知らずに普通に使ってるけど、そんなものがしかも世の中に溢れてるけど、とてつもない苦労によって生み出されてるんだ。
だからね、数千万数億っていうレベルで開発の単位っていうのはあって、それをAIの途上によって破壊されてきてるんだけど、結局その製品レベル、今僕が作ったやつとかだと社内で利用するレベル。
なんだったら池ちゃんさんには使ってもらえないんですよ。僕か阿部ちゃんかみたいな感じ。ターミナルいじる前提だったりするから。
なるほど。
だから収録したら僕がそれで変換したやつを池ちゃんさんに渡して、あとプレミアムでどうにかしてもらうみたいなフローにしてるんですけど、
これを池ちゃんさんに使ってもらうようにするにはどうしたらいいんだろうみたいなとか、社内だけでもいくつか段階はあって、みたいな感じなんで。
やるとしたら、それこそ本当に月1万でも使いたいですっていうのが100人いるんだったら頑張ろうかなみたいな感じなレベル。
なるほど。
それか普通に編集を受けよう。
なるほど。
そっちの方が効率的。チューニングとかをこっちでできるから。
確かに確かに。
現段階では確かにそっちの方が良さそうですね。
そうですね。だから逆に編集依頼したい人いれば言ってくださいって感じですね。
はい。
あっ。
はい。
いる、いますよ。いますよ。多分。今回の回は多分ポッドキャストウィークエンドに参加してた方が新しく聞いてくれてるかもしれないんで、皆さん苦労してると思うんでね。
うん。
はい、もし何かあったら。
うん。まあ音声編集、まあけどこの自動化を結構俺が熱量を持ってやってたのにはちょっと理由があって。
はいはいはい。
ポッドキャストの編集自動ワークフローだけだと多分こんな時間かけてないんですよ。
はいはいはい。
動画ポッドキャストにしたい、ビデオポッドキャストにしたいっていう思惑があってですね。
はいはいはい。
まあ週1出すので2個ポッドキャストやってるんですけど、まあまあいいかなみたいな感じで。
はいはいはい。
まあまあそれも多分けどかけてる人だともっとかけてるとは思うんですけどね。
多分うちは相当効率化して、システム化以前の効率化をしてやってたりするから。
はいはいはい。
まあもっとかけてる人も多分多いと思うんですけど。
うんうんうん。
あのそれを超えてビデオポッドキャストにするんだったらちょっとけどハードルあるよねみたいな話をしてて。
週1動画まで目指してやると、まあまあそれこそさっき言ったもう人じゃできないというか、
もう僕たちじゃ週1で動画ポッドキャストを出せてるビジョンがない中でシステム化することでできるようになったみたいなのが実現できるから、
そこをちょっと見てるっていうのは前提としてあるかもしれない。
なるほど。ありがとうございます。
みたいな感じですね。
うんうん。
そう、まあけど動画ポッドキャストに向けてもう動き出してるんで。
ありがとうございます。
すみません、完成しましたと言ったら完成してないです。
このポッドキャストを今多分これ聞いてる人配信してるのを聞いて、
これはAIワークフロー、システムによってある程度編集されたものなんだなみたいなのは多分聞いてもらって、
それは間違いないんですけど、そういう意味ではちょっとまだやることがあるっていう。
ではね、じゃあビデオポッドキャストに向けて。
そうなんですよね。
進めていけたらいいですね。
ビデオポッドキャストのほうが聞かれると思うんで。
まあてかトレンドがもうそっちなんで。
ビデオポッドキャストになったら新しくできることってどんなことがあるんですかね。
もの紹介しながら喋るとか。
そういうのもできるね。そういうのもできるし。
あとはYouTubeに普通に動画として上げれるっていうのもあるし。
そうかそうか。
あと実際鶴井村とかに行ったときに収録みたいなのをしたら、そこの場所をちゃんとあれしながらできるよねって。
確かに確かに。
確かに僕らがこうやって全キャスターでやってるだけだとそんなに想像がくらまないけど、色々できますね。確かにそういうふうに考えたら。
あと人の顔を写って喋ってるのを聞いてるほうが見れる人も多いと思うし。視覚的にっていう。
ただこうやって二人の顔が写ってるだけでも。
違う。
あとなんかショート動画よくやるのは、これは広めていくという視点では、結構いい発言があった箇所を切り抜いてショート動画で回すとかはよくする。
はいはい。最近ちょこちょこ見るやつですね。
そうそうそう。ショート動画で1分で見どころポイントだけを抑えて出していくみたいなとかもできるようになってくるっていう。
なるほどね。楽しみ。動画って大事なんだなって最近僕もなんとなく思って、自分でちょこちょこ撮るようにしてるので。
仕込みをしながら横でポイってカメラを置いて回しながら作業して切り張りして出てみたいなのをなんか最近ちょこちょこやってるんですけど。
やっぱり動画になると見てくれる人が変わってきたりとか、まだ全然続けてないんであれですけど、それでも多少なり今までと違って動きが出てきてるので、やっぱりやった方がいいんだなとはなんとなく思いながら。
確かに確かに。あとあれだな、うちと同じ編集フローに寄せる機械があれば使ってもらえるかな、このPodcast編集ワークフローを。
あーはいはいはいはい。
着替えって言っても簡単じゃん別に。全キャスターでやってやるだけだから、なんか別にそんなに難しい。全キャスターも無料だから別に使ってるの。
そういうのでうちのワークフローに乗っとってやる。でも今のこの編集作業大変だからどうにかしたいみたいな。人がいれば合いそうだね。
確かに。あとこれから新しく始めたいみたいな人に対してもいいかもしれないですね。
確かに確かに。
その方が今までやってきた流れとかがまず前提としてなくて、どうやったらいいんですかっていう。
カラーって感じだよね。
カラーだったらもう全部この通りにやってくださいでもうすぐ話なんでね。そうすると楽ですよね。だから新しくポッドキャスト始めたい人のハードルが下がるみたいな。
あーそうですねそうですね確かに。なんかやっぱ自分たちの工程を変えるのって結構重たい。
重たいですね。それがどんだけ楽になるって分かってても1個変えるって単純じゃないですもんね。
確かに確かに。そこのネジが外れてる人はAI向けの人だね。
だからヤンヤンさんのことを今思いながら喋ってましたけど。ネジが外れてるしなんか意識して外してるというか。
意識しないとやっぱ僕はいろんなことでまだ立ち止まっちゃうんですよね。これはだから料理もそうですし普段の仕事も全部そうですけど。
確かに意識して外すの大事かもしれない。
意識して外す。
確かにネジが外れてるじゃなくてネジを外してる人の価値観。
そうですね。最近料理に関してはネジの外し方が分かってきた。例えば毎週料理を変えるためにはどうしたらいいのかを。
もともとは絶対そんなことできるわけない。季節ごとにしか料理なんか変えられないみたいなのを。
本当に全部常識を取っ払って考え直せるかどうかみたいなのって結構意識して外していかなきゃいけないから。
そういうことができる人は結構稀だし勇気がいるんですよね。勇気もいるし根気もいるし。
周りにも伝えないといけないからね。
そうなんですよ。そこでもう一回いつも通り出てなっちゃうこと多いですね。自分一人ならまだしもっていう感じ。
「ネジを外す」発想と動画ポッドキャストへの展望
個人的な考えとしてそこにワクワクを入れるっていうのは結構。自分が面白がってるだけでいいんですけど。
これも単なる効率化っていう視点じゃなくてそのワークフローを変えることそのものにワクワクしながらやってると勝手に周りも一緒にワクワクしてやってくれるみたいな。
わかります。それは結構僕も意識して。自分が苦しんでたらなんでそんなことがないかなって周りは絶対思うし。
苦しいものとして共有して苦しみながら一緒にやることを共有しなきゃいけないから。
これめっちゃおもろい発見ありましたよみたいな。こうしたらこうできますねみたいなの。
こっちがその視線で言ってあげるとやっぱり同じような目線でもしかしたらこれもっとこうしたら楽ですねとかこうしたらもっとおいしくなりますねみたいな感じで
同じ目線で考えてくれるようになるから。これは結構大事ですよね。自分が楽しむっていう。
結構大事よねその辺は。
そんなふうに思いますわ。
そんな感じでそうだな。確かに。逆にどれくらい周りのポッドキャスターの人が編集に時間かけてるのか知りたいですね。
知りたい。ぜひこれ聞いてるポッドキャスターの方がいたらぜひ教えてください。
知りたいなって思うな。うちは多分結構そういう意味では割り切ってて話がどんだけ割り切りによって効率化してるから
多分こだわったらいくらでも時間かけれるじゃんある意味。
それはもうそうですよね。何でもほんとそうだし。
だからまあけど、そんなにリソースがないっていう前提があるから。
あとちゃんと洗練されたコンテンツというかに価値覆を置かないようにしないといけないなって逆に思うよね。
クオリティーに振ったら絶対に大きい資本があったりそれ専業でやってる人に絶対負けるというか価値用もないみたいなのが。
あるからどっちかというとこう自分たちの本音を話すとか一時情報を話して
こういう世界もあるんだなみたいなのを垣間見れるようなのの方が自分たちのユニークな価値として出せるのがあるから。
台本もないし。
台本もないし。5分毎日もあるし喋ること。
電キャスター繋いで今日どうしましょうかって言って喋るぐらいのやっぱり
だからこそ自分たちも気楽に電話して相談するぐらいの気持ちで続けられてるし。
でもそれが逆にちゃんと台本作って番組っぽくやってるところとのある意味差別化を
知ってるというか。
安部ちゃんと昨日話しててさ、安部ちゃんってAI駆動開発部の事情の方の
ポッドキャストを一緒にやってるメンバー、エンジニアと一緒に喋ってて
普段僕と安部ちゃんって横で作業してるんですよ。
収録するなら収録するかって言って僕が違う部屋に移動してマイクをやってるんですけど
そこそこノイズもカットしてくれるからお互いの声入んないなっていう前提で考えると
常にマイク繋いでて、たまに設計の話とかして盛り上がったりするんですよね。
3分以内にチャンク分けされるんだったら、もう一生繋いどいて
もう撮ろうってしなくていいみたいな。
それめっちゃおもろくないですか。
僕一回やろうと思ったのが仕込みの風景をずっと撮っておいて
例えば僕が伊藤君と試作の時にちょっと面白い話してたりとか
これもっとこうした方がいいですね、ああした方がいいですねとか
すごい試作で頭抱えてる姿とかって旗から見たら結構おもろいよなって思って
だからそれをずっと回しといてそこだけを切り取って
継ぎ接ぎで仕込み風景としての動画として撮ったら
結構面白いものできるんじゃないかなって思って
試みたことがあったんですけど、さすがに4,5時間とかを
自分たちで面白い場所見つけながら切り張りするみたいなのが全然現実的じゃなくて
ちょっとアナログ人間の僕には無理だって思ってやめたんですけど
そこがちゃんとね、そうやって自動でやってくれる仕組みがあったら
それこそ映像と一緒にポンポンポンって面白い箇所だけ繋いで
ショート動画みたいになったら結構おもろいっすよね
そう、なんかできそうだなっていう話をして
結局文句間は全部カットしてくれるし
全部文字起こしされる前提なんで
普通昨日のさっき言ったみたいな5,6時間とか撮って
それを人が見るのは大変だし
それをちゃんと文字起こしされてる情報として言語レベルでやってるんだったら
そのスコープは切れるから
その部分だけ音声を編集のワークフローにかけて
最終出力出すみたいな感じにしたら
データが大量になりすぎて
AIがパンプすることもチャンク分けしてるし
文句間切ってるからないし
なんかいけそうだなみたいな
めっちゃおもろいじゃないですかそれ
そう、っていうのを話してた
そういうことができたらもうね
一時収録するってことすらしなくていいのにね
これですよ皆さんネジを飛ばすという発想は
ポッドキャストの収録をとかいう風に考えてる時点で
もう多分ネジが閉まってるんですよ
概念をね概念をどんどんどんどん更新して
ぶっ壊していかないと
なんかそんな発想にならないですからね
これはネジ外し癖がちゃんとついてる証拠ですね
確かにそう
すごい
えー面白いなんかそれちょっと興味あります
僕がさっき言ってたのは仕込みで動画とかっていう話
またねちょっと話が変わってはきますけど
いけそうだないけそうだ
僕結構それやりたくて
それで言うと今このちなみにこの音声文字起こしを
したいと思ってるとかみたいなもう一つの理由が
Lシフトで長期的な将来的なところで
厨房に設置する常駐録音型の
簡単に言うと飲食店の秘書みたいなのを置いて
例えばトマト発注しといてって言ったら勝手に
買い物カゴ入れといてくれたりとか
あの仕込みやっておいてって言ったら勝手に
タスク貸しといてくれたりとかみたいな
なんかそういう常に厨房の録音とかを取っとくことで
例えば言った言ってない問題とかも
後で聞き直せたりとかもするし
そういうパワハラ問題の解消みたいなのも
なりそうだなとかみたいなとか
そういうのも含めて考えて
そうするとずっと24時間録り続けるみたいな感じになるから
そうするとそもそも非大化しすぎるからデータが
だったら文句緩和とかそういう風に
データを効率的に回すみたいなのと
あとそのPCのリソースで文字起こしできるようにしてて
推論はAPIで課金が発生するんですけど
文字起こしは実はMacBookのリソースを使うんですよね
だから計算機リソースを使うから
お金かかんなくて文字起こししてくれるんですよ
今僕が作った仕組み機には
みたいなある程度飲食に導入しようとしたら
スパーも大事だよねとか思ったときに
そういう仕組みを一気にちょっと勉強が出られるか
みたいな感じでやったのが一応あって
その中で見守りカメラっていうのがあって
防犯カメラみたいなやつで
それって24時間録り続けてクラウドストレージとか
課金料金によって課金のプランによって
クラウドストレージに同期されるパターンとか
ハードディスクに保存されるとかいろいろあるんだけど
そこに音声データと映像データを
全部保存されるらしくて
それを音声だけ抜き取って
発話区間だけ切り出して文字起こしして
割と多分器用の厨房でもできそうだなみたいな
感覚がある
映像備とかそういう話になると
あれだけど
それはまたね
そういう動画は別に
作家性持った動画とかは別に自分たちで撮りゃいい
それこそ
防犯カメラからの映像みたいな感じで
定点でいいと思って
定点が一箇所か二箇所ぐらいあって
あとはマイクだけずっと付けといてとか
あとは普通に仕込みをしてる
多分その見守りカメラって防犯カメラみたいなもんだから
何時何分のどこの映像っていうのも
絶対情報として持ってるから
それと掛け合わせで推論したら
例えば二つのカメラを置いておいても
同期できる
理論的には同期できる
だから多分2カメとかでもできるっていう
すごい
いいな
ずっとやりたいと思ってるんですよね
勿体ないって思う瞬間がいっぱいあるんですよ
仕込みしてて
今すげえ面白いな自分みたいな時がある
今すげえ面白い悩み方してるなとか
基本ずっと頭抱えてるんで
四六時中頭抱えてて
ああでもないこうでもない
なんでお客さん来ないのかなとかずっと喋ってるわけじゃないですか
結構おもろいのになって思うんです
文字起こしできた情報元にこういうノートとか書いてもいいかもね
みたいな提案をするとかもできるしね
こういう話だからこういうノート書けそうみたいなところも
飲食現場でのAI活用可能性と価値
ガイダンスで出して
それをベースに業法はどうとかいていく
確かにねノートを書くときの一番のあれって
何書くか問題なんですよね
書き始めたら僕は書くの好きだし
自分らしい文章みたいなある程度なんかできてきてるから
なんかがあれば書けるんですけど
続けて書こうっていうのって難しいので
普段何かが起こらないと
何書こうかなみたいな感じになるじゃないですか
だからそれでノートに書けそうなこと
リストだけでも作っておいてくれたら
あとは自分でそれを見て
じゃあこれについて書こうってやっていけるわけですもんね
書いてるのは自分だみたいなそこの
例えば自分のこだわりがあっても
それは守れるし
提案をしてくれるから
しかも自分にとって一番の
ノート書くっていうことに対しての
壁みたいなのはやっぱり
書く内容を決めることなんで
内容さえあったらいくらでも書けるなって
いつも思うんですけど
中房の録音とか中房の映像って
特に録音発話データっていうのは
相当価値があるんじゃないかなって思ってて
さっきのノートみたいなのもそうだし
映像にするもそうだし
発注するタスク量もこなすという点で
めっちゃいいだって
分量とかを普段試しながらやってる時とかに
パッて言う時にメモを取り忘れてることって
結構あるじゃないですか
あれこれ何ドラムやったっけなみたいな
メモっといたりもできるし
棚卸しの時にさ
これ何個これ何個っていうのを言うだけで
棚卸しに記入しといてくれるみたいなとこもできるし
すごいですねマジで
仕込みしながら在庫の数とか言ってけば
発注のリストは仕事終わったら
できてるわけですもんね
そうそうそうそう
あれを仕事終わりに全部見直して
発注かけるとか馬鹿らしいじゃないですか
結構あの作業馬鹿らしいから
うちでもなるべくそこの
仕事終わってからすぐ買えるように工夫をしていこう
っていうのはずっと言ってて
発注作業も使った時に在庫をちゃんと買っていくとか
発注するラインに
その都度打ち込んでいくっていうので
僕の中ではそれが最大限の効率化だけど
そこからさらにネジを飛ばすと
山本さんみたいな発想になっていくんですよ
書き込む必要もない
そう書き込む必要もないというか
厨房の中の動きってスポーツと同等だと思って
そうした時にサッカーしてるうちに
誰が携帯触ってるんですかみたいな話だと思って
スマホ出して
なんかラインで書き込んでおくとか
ホワイトボードとかね厨房とかでよくあったら
わざわざホワイトボードのあるところまで行って
ホワイトボードでとか
みたいなのってなんかちょっと違うなっていうのが
ちょっとなんか起こって
みたいな
そう結構けどね
大西もちょこしは奥が深くて面白かったですよ
日本語の難しさとAI以前の技術
今話聞いてるだけでも
やばいなって思いました
日本語がっていう話してるのすごい面白いなって思ってて
日本語って結構やっぱ
ゆる言語ラジオあるじゃないですか
あれもビデオ
ポッドキャストなのかなショート動画か
ショート動画結構回ってくるからよく見てるんですけど
日本語の変なところみたいなのが
いっぱい外国の日本語
日本語研究してる外国の人とかいっぱい言ってて
面白いなって思いながら聞いてるんですけど
あとコテンラジオとかでもたまに
日本語の話とか仏教の回とかでも
ちょっと言ったりしましたけど
すごい日本語ってなんかエモいからっていうのが
よく出て
なんか
なんとかで…で終わったりもするし
で何とか言わなかったりもするし
結構だから
感情的だったり
エモーショナルな雰囲気だったり
さっき言った音の問題とかもあるし
結構読み込みが難しいんだろうなって
すごい話聞いてて思って
そうなんだね
日本語特有の難しさってあるんだなっていうのを
あとなんか
その前処理の前段でVADっていうのを挟むんやけど
VADってやつが
発話区間だけを検出してくれるみたいなのがあったりして
こういう
喋ってないところとかっていう切り分けを
そのVADってやつを使ってやんねんけど
それも何かいくつか使い比べてみて
これが良さそうだなみたいなのを今使ってるんやけど
なんかそういう
AIが出る以前の血の結晶みたいなのが結構あって
やっぱAIのただの文字起こしだけだと
難しかった部分はやっぱあるから
あーなんか
人間ってすごいんだなって
AI作った自体も人間なんだけど
とはいえその
AIの文字起こしだけじゃやっぱできない部分があるから
人間って
過去の人たちに感謝だなっていう
積み上げてきた人たちに感謝だなって思いながら
だからその中国漢字から日本語に変換するのとか
ポッドキャスト編集自動化の応用と未来
なかなか
ありがとうございました
僕がこんな料理ばっかしてる間に
このポッドキャストのうちのほかを
そんな
苦労しながらやってくださってたなんて
悲しみを聞いてましたが
感謝しております
とほうもないよね だからめっちゃ壊しまくったからね
一応整理されてる情報として言ったから
なんだろうこれとこれを組み合わせてみたいな
それを組み合わせるためにも結局それに適合させるために
プログラムを書いていかないといけないから
うわーまじでもうなんか
考えただけでも僕は頭が
頭が痛くなる
自分で
自分で撮った何枚かの動画を
継ぎはぎするだけでもなんかもう
ちょっと頭が痛いのに
おだしょー 動画編集とかもね自動化するのやりたいなって
やれたらいいなー
おだしょー ね まぁけどできそう
できそう
ちゃんとあるんですねもう
苦労するビジョンが
いやぁ期待してますこれからもいろんな
ネジの外れた提案を
楽しみにしてます
おだしょー そんな感じで今日は全然職場買ってない
まぁポッドキャストには変わらないですけど
ポッドキャストらしいねお話を
まぁでもポッドキャストをやってる方がすごいね
いろんな方に
おだしょー 興味ある話なんじゃないかなっていうのはあるんでね
ほんと是非なんか
興味ある方はなんかこう連絡をね
くれたりしたら面白いかも
なんかそもそも会社としてやってて
結構スタッフに蓋かけてるみたいな人とかだったら
余計会うかもしれないですね
おだしょー あと単純に本当に興味あるかどうかを知れるだけでもね
多分ありがたいから
使いたい云々はちょっと一回抜きにしても
面白そうとかだけでもね反応があるとすごい
ヤモンさんのイメージが
今後もっと外れてくれるかもしれないから
ヤモン 確かに
ヤモン はいじゃあありがとうございます
こんな感じで今日をやれたらと思います
ありがとうございました
ヤモン 本日もまかないラジオをお聞きいただきありがとうございました
いかがでしたでしょうか
今回の話題はポッドキャストウィーケンの出ましたよっていう話と
それに付随してでもないんですけれども
ポッドキャストの編集の自動化についての
話をさせていただきました
いかがでしたでしょうか
普段はね食の話とか
たまにこういうふうに若干テクノロジー入ったような話から
飲食への活用どうするかみたいな話とかをしているので
もし気に入ってくれた方はいいねやフォロー
高評価ぜひお願いいたします
それではまた次回もお楽しみください
バイバイ
01:11:33

コメント

スクロール