おはようございます。2025年5月31日朝の収録です。
今回もちょっと覚書き的な感じで、今画面の方スポーティファイガーだと映像見られると思うけど、今GoogleのAI Studio開いてるとこです。
なんかねこれがね、ちょっとうまくいったことがあったけどなんか逆にうまくいかなくなっちゃったみたいな状況で煮詰まったので、
この状況も含めて記録含めシェアっていうところも含めてって感じで今回収録としています。
今目の前に映しているのが最近Twitterとかで特に騒ぎになっていると思うけど、Google AI Studioの件がいろいろ話題になっていると思います。
その中でも簡単にアプリが作れる。今最近などバイブコーディングなんて言葉いろんなところ飛び交っていると思うけど、
普通に交互の感じで指示を出すことによって簡単にアプリが作れてしまうみたいな感じの中で、それがGoogle AI Studioの中でも今まさしく目の前に映っているもの。
UIちょっとシンプルめだけど、これアプリを一応作ったっていう感じになります。
まだね、ちゃんといかないのは細かいところがうまくいかないから止まってしまってるんだけど、
何かっていうとポッドキャストやってる人とかだったらいろいろ苦労しているところでもあるかもしれないけど字幕?
文字起こしプラス字幕データの作成っていうアプリになります。
ポッドキャストって言うとちょっとくくり違うか。どっちかというとYouTube。YouTubeを投稿しているクリエイターの人とか、
もしくは動画編集をしていて動画編集ソフトの中でテロップを入れるとかそういう時に役立つものとして今作ってます。
実はこれ前提に当たるところで、実際に使ってもらえる形でこのプロンプトでやればいい感じにできますよっていうのを収録したんだけど、
ここ最近の流れ通りまたそれがボツになっちゃいました。
なっちゃいましたって言い方おかしいけど。
言ったのとそのプロンプトでやった時の挙動がちょっと揺らぎがあったので、これは公開できないなみたいになっちゃって。
というのもある中アプリ作ってみようかなと思って今回に至っています。
ざっくりこの画面見ながら説明をしていこうと思うんだけど、音声ファイルをアップロードしてそれを文字起こしして成形して字幕ファイル。
YouTubeの字幕のアップロードのところからアップして簡単に効率化というところで完了できるみたいな。
というところを今回触れようと思います。
これ何がキモかというと字幕が簡単にできるようになると、以前から触れている通りこのYouTube自体がどんどん無意識の状態でのグローバル化という時代に進んでいっていて、
昔からそういう時代が来るんじゃないかって話はしていたと思うけど、AIに翻訳してもらいやすい話し方が重要だとか。
今って自動吹き替えの機能とかついてしまったので、つまり元のベースになっているのは字幕データだと思うんだよね。
まだ確定的ではないし現段階では関係ない話なんだけど、今後ミスをやると字幕をきちんと効率的に設置しておくことによって別の言語で吹き替えされる時とかの元になる。
あとは別の言語で字幕で見てもらうというレベルの時にも元の日本語の字幕がきちんとしていれば別の言語を設定するときに自動翻訳というか翻訳機能を使うことによって字幕が簡単に設置ができるので、
そういう意味合いで字幕がめっちゃ重要だなという。あとはテロップを入れているところも手間がかかるところなので。
というところで今回の話、ざっくり触りながら、本当にこんな状況でここに悩んでますとかそういうのも含めてになるんだけど、記録していると思うのでよかったらチェックしてみてください。
この番組は、KTがSNSアプリの新機能やエンタメガジェットの話題を4段だらけで紹介していく。まとまらなくてもまとめ。きくまとめです。
快速再生、ながら劇で情報収集に活用してください。
はい、ということで実際ちょっとここ触ってみます。このまま見た目の方で解説するので。
カーソル映ってないなこれ。ちょっと分かりづらくてごめんなさい。
カーソルを映すってこれできるはずだけどな。どっからやるんだ。ちょっと待ってください。
すぐできないか。カーソルを映すという設定が。あれカーソルキャプチャーってなってるのはダメか。
ちょっと分かりづらいかもしれないけど、この左上のところに今きくまとめ0619ミックスダウンMP3っていう名称記載があると思います。
ではここにファイルをドラッグとかクリックしてアップロードすることによってMP3のデータを取得して。
これ一応ボタンを押すようにしちゃったかな。ボタンを押すと今ここの右に出てるみたいに文字を更新してくれます。
ここは今本当に調整している最中で、今画面隠れて左側のほうにソースコードあると思うけどもっと左にシャット欄があってそこで指示をしながらここおかしいか直してみたいなことで調整している最中です。
だから完璧ではないんだけど。とりあえず文字起こし。文字起こしなんてさもうなんの普通にそれこそJATGPDだろうがGMEだろうが簡単にできると思うけど。
この状態からここのねちょっとややこしいんだけどね。srtっていう形式のファイル。いわゆる字幕データになります。
この.srtという形式だとそれをYouTubeの字幕データのところにアップロードすることによってこの内容が反映するしタイムコードと合わせて表示するタイミングとその表示したい文字列というのがセットで記録されるので。
そうとかPremiere Proに読み込んでペロップデータとしても使うことができます。
これの変換機能っていうのがあるのでこの今出力したテキストに対して変換ボタン。ボタンもまだ整理ついてないんだけど。
リジェネレートsrtやるか。今やりました。実際もうすでにできてたものだと思うんだけどこんな感じで字幕ファイル見たことある人なら分かると思うけど行数12345って普通に行数とあとは行数というか順番か表示するに対してタイムコード。
0秒から例えば1秒までの間にこれを表示するとか最初こんばんは2つ目秒数指定があって何月何日みたいな記載があってこんな感じでずらっと続いています。
ここに対して一応これで完成ではあるんだけど、これが上手いこと整形できてないとまずいじゃん。
例えばこことか上手くいってなくてめちゃくちゃ文字数がもうオーバーしてしまってるとかそこがねなかなか難しいところであり、
例えば1コマに収録してボツにしたっていうものに関してはその時アプリの話じゃなく普通にGoogle AI Studioに直に音声データを渡して毎回プロンプト指示していました。
それで最近やっていました。効率化して字幕ファイルを手に入れるっていうね。
それでやった時はねなんかね割とうまくいってたんだよな。
要はさこの1回に表示する文章量とかあとは回用のタイミングだとか最大でも何文字までにしてとかっていうのがうまくいってたんだけどアプリ化した時にちょっとね。
なんかね多分ねあのベースのジェミニのジェミニのジェミニの力って言い方したらおかしいかな。
AI自身の力であのやっていてくれたところにちょっとしたプロンプト加えただけで収まっていたものが今現状っていろんなこと積み重ねて、
いやそれはダメこういうパターンはダメこういうパターンはいいとかって言っちゃってるか多分ね上書き上書きになってるんだよね。
1回頭の中リセットしてもう1回やり直してって言っても多分できてないと思うので。
要はね白紙に戻してって言ってもベースの状態があるところからもともとこれを許可許可こういうふうにするって言っていたものに対して俺が後付けでいやそうじゃなくてこれはこのパターンはダメっていうと
ベースがもう積み重なってる上で除外を加えてやっぱそうじゃないって言ったらその除外の上にやっぱり許可って加えてみたいなことになってるんじゃないかなってちょっとなんとなく感覚的に
実際にそんなに頭悪いかもわかんないけどそういう印象を受けてなんかねうまくいかない状況にあります。
まあでも見てもらったらわかる通りこのさ開業のタイミングとかこういうのがある程度スッキリすればこれをもうあのYouTubeの方にアップしちゃえばそれでも解決なので
プラスもう一個言うとプレミアプロまあ個人的に使ってるのはアドビのプレミアプロなのでそういう言い方をしているだけで他のソフトでも多分同じようなことはできると思うんだけど
プレミアプロで言うとこれで書き出した.srtファイルを普通にファイルメニューから読み込みをしてそうすると
あのデータの素材が並ぶところの一覧に並ぶのでこれをタイムラインにドラッグすることによってテロップとして表示されます
プレミアプロ上で文字起こしとかキャプションの作成やったことある人だとわかると思うけど勝手にテロップが入ってくれるんでね
それを見た目を変えるとか文字色変えたりサイズ変えたりできるんだけどそれと同じことがこの字幕データからできます
そうなるとさ結構楽じゃないまあねこういうこと試したことある人たくさんいると思うんだけど例えば有名なやり方だといっぱい動画とか上がってるようなものだと
よくあるのはプレミアプロプラスブリューとかっていうやり方をするというケースってあると思うんだけど
多分ねそれよりも手っ取り早い気はするんだよなあっちもいいところメリットあると思うんだけど
なんかね本当にねあの結構ななんかいろいろ時短効率感につながるまず動画編集段階でフルテロップって結構手間だし時間かかると思うけど
これがねもうあれだね特に本当に完璧にするなら大変かもしんないけどなんか俺がやってるぐらいの感じでさ
まぁちょっと多少間違えててもいいかなぐらいだったら本当になんか数分でできてしまうし
そうでなおかつYouTubeの字幕データの方にも同じものが流用できるわけで
そうってなるとさ冒頭でも軽く触れたけどその日本語の字幕データから海外の字幕データへの翻訳をしていろんな言語に対応させることがまずできるし
プラス今は日本語の動画を上げた時に勝手に英語に吹き替えてくれて海外の人にも見てもらえるようなそういう機能が備わってきたりしている段階にあります
そうだから今後の発展としてこの日本語の字幕をきちんと設定しておいて
例えば現段階はまだ多分できないんだけど今って勝手にもうあの吹き替えの処理が始まってしまうんだけど
これがゆくゆくは日本語の字幕のデータをこの状態整えたからじゃあ吹き替えの方を再作成しようみたいなことができていってもおかしくないと思います
なんか普通の流れとしてありそうじゃん
そうなった時にこの日本語の字幕がきっちりしていれば当然英語で吹き替えとか英語に限らずさ色んなわけわからない言語全然わからない言語でさ
吹き替えされることが今後増えていったとしてもその時にもより正確に翻訳をしてもらえるという状況になるので
そういう意味でもめちゃくちゃね今のうちに整えておくのは重要なんじゃないかなっていう風にそこら辺もあるので
あとはちょっと言うと気になくなっちゃうけどあの音声の音声じゃないな
字幕のSEO的な効果に関してはもうずいぶん昔から俺話してたし世間的にも言われてるし
逆に言うとSEOの逆転バージョンで考えるとNGワードを言ってしまうとAIがそこら辺ってもう把握できるから
それで制限かかってしまったりする可能性があるってのはもう結構昔からそういう話本当4,5年前ぐらいからあったかそこに関しては
そうあったから当たり前なんだけどそれをねもう明確な形として
なんか俺が前に話したものだとYouTubeの検索結果に字幕の一部分がハイライトで表示されることっていうのがあります特定条件において
もうずいぶん前からそうなんだけどあんまその話題上がってないから世間的にどのぐらい認知されてるのか分かんないけど
具体的に例えばキーワードでさ何でもいいポッドキャストって検索したとして
普通に考えると検索結果がずらっと並ぶところってさ意識が行くのってサムネイルとタイトルと説明文だと思います基本的には
そこにぴったりマッチする文章が字幕の中に入っていると
タイムスタンプが入ってそのポッドキャストって言葉を発した場所が3分38秒だったら3分38秒してそこに字幕ファイルの文字列が表示されるんだよね
そうってことは100%言っていいかな字幕データを見て検索結果に反映してるってことになるじゃん
そういう意味合いでも当たり前に重要なことであるんだけどより明確にそういう形として見て取れたっていうのが結構前の話だけどあったので
そこら辺も含めて今回こんなことしてるって思います今回こんなことしてるっていうか本当に常々気にしながらやっていたところに対して効率化できればっていうところで今回アプリっていうのもちょっと試してるんだけど
実際にあとはもう一パターンやってるのが別のタブも一個用意してあってこれはおまけ程度につけただけなんだけど一応字幕を編集できるような機能もここに入れました
すごい機能だけどAI触ってる人とかTwitterとかに眺めてる人は言うまでもなくしてると思うけど本当に簡単なシンプルなお願いをしただけで全部実装してくれます
そんな細かいこと全然言ってない勝手にいい感じにしてこういう感じになってますむしろ削除機能とかいらんのに削除して時間調整してまでやるつもりじゃないから
この画面でいらないって言ったんだけどちょっと残しておきましょうみたいなので消してくれなかったら作ったものを消すのがもったいないのかしら
あとブロックの追加機能とか絶対いらんよねこれ自動でだったらいい感じに揃えてくれっていう話だけなんだけど
ちなみにこれもうどんなとこまで工房で伝えてできるのかなとかそのぐらいの見合いでしかないんだけど一応ここに再生ボタンつけて
何のそこら辺の字幕のアプリでもそうだけど例えばブリューとかもそうだしYouTube内の字幕のところもそうだと思うけどここに再生を実際にして
ここで聞きながらここの文字を調整するみたいな何て発してるかを確認した上で打つっていう形
そんな形も一応できるようにしましたただこれはこれいらないんだけどそんなことよりもジャストでちゃんと揃えてほしいなってことなんだけど
ここが調整したいとかせっかくやってるから試しってところも含めて機能つけたいとかいやそうじゃないといけないんだから
なんかねなかなかうまくいかない多分もう一回1からプロンプト初期のプロンプト考えてもう一回別で作り直したほうがいいんじゃないかなってちょっと思ってるところです
ちなみにこのGoogle AI Studioだと普通に多分このまま公開とかシェアしたりとかもできるはずなので
だから完成したら公開って形を取ろうかなとも考えたりはしてるんだけど
その感じでいろんなものちょっと作ってみるのもありかなっていうなんかこの痒いところに手が届く的な感じの
まあつってもな自力で普通にジェミンに使ったりとかいろんなAI使えばそれなりにもうできてしまうんだけど
なんか1個さ形が決まってもうこのツール使えばってものが何個か並んでいたらもうめちゃくちゃ便利だと思うので
あとは例えばあれかなんかまあ悩ましいところとして字幕の今回のデータのこの表示に関して
実はプレミアプロ動画だったら文字数って極力少ない形のほうが理想的だと思うんだよね
文字サイズ小さくなっちゃったりとか文字数の制限もあったりするので
対してYouTubeの字幕のほうだとまあ割と比較的長くても問題はない
あとは句頭点とかも入ってたってそんな違和感ないと思うのでむしろ目で読んでいくときに
句頭点って入ってたほうが字幕に関しては良いのかなみたいなところすらちょっとまあ個人的には思ってるので
対してテロップに句頭点って入れるのってあんまり良くないなっていうところがあるから
そういうところで今これちゃんと機能してるか分かんないけど
このねこれは今英語で全部英語だけど日本語にはもちろんできます
英語のほうがちょっとしっくりくるかなと思って英語で見ちゃってるんだけど
ここやると今あれか丸だけになってるか要は句頭点をそのまま残すかもしくはオフにしたら
オフにしたらスペースに変換するかなどっちがどっちか分かんないけど
これがあればその字幕とさYouTubeとの切り替え用途で切り替えられたりするかなっていう
同じ感じでこれもベースがきっちりで記載すれば例えばYouTube用と動画編集用って
ボタンを作って動画編集用って方を押したら例えば句頭点はスペースに変換してなくして
なおかつ文字数も一行に15文字とか10文字までとかっていう指定のものにする
逆にYouTubeの字幕っていう方のボタンを押すと例えば同じこの素材データから
今度は句頭点はアリでなおかつある程度の文字数横20文字ぐらいまでOKとか
そんな感じに切り替えるとかそれができたらベストなんだよな
同じ素材感もそこまでできちゃえばみたいな感じで
後付けになってしまうけど動画のときに動画編集段階で音声データのみ
例えば余計なBGMとかできるだけなくしたほうがいいと思うけど
音声データで書き出してその上で字幕ファイルを作って
俺だったらプレミアプロの中に行ってテロップとして使うみたいな感じになるわけだけど
本当にアップロードした段階でフルテロップだし字幕ファイルも完璧で
もしかしたらだけどこれ俺試したことないけど
アップした直後にすぐ字幕ファイル正確なものアップロードしたらどうなるんだろうな
あの吹き替えってそこで吹き替え処理が始まるっていつの段階か分かんないけど
アップロードしてすぐ始まっちゃうと思うんだけど
俺がそこを自分でちゃんとしたのを上げたら
その吹き替えそれに合わせてちゃんとした吹き替えになってくれるのかなっていう
ちょっとそこの疑問もあり試したいところがあるんだけど
そうみたいなところでこんなところちょっと試してるってところです
なんかうまくいくのか分からんけどどっちにしても使える形にするか
どっちにしても最低限使えるようにしよう無駄な機能削ったとしても
とりあえず現段階はもう普通にGoogle AI Studioのほうで
直接プロンプトでやっていることをアプリ化しようというところです
せっかくなのでこの流れで触れると逆に最近試していていいなと思ったもの
まあそんなことやってる人はいっぱいいるだろうけどさ
まああれかなAI側の人たちは目が行くけど逆に例えば動画編集とか
YouTubeに動画を上げようっていう人があんまり目が行かないかも
いやまあ試してる人はいっぱいいるだろうけど
何かっていうと今触れたみたいな文字起こしとか音声データが関わるとこなんだけど
例えばなんだろうななんかいい例が浮かばない
例えばじゃあ映画のレビューとかっていうのを動画にしようとしたとします
でダラダラダラダラさこう話した中で
ちゃんと本当は台本化作って話すのが一番いいんだけど
どこが見どころでとかさここが微妙なポイントでとかやれば一番いいんだけど
それもなかなかさもうがっつりやろうって決めないとできないじゃん
ではなくダラダラ喋った中でもそれをうまく編集して
動画一本いい感じにまとめたいみたいなことって
誰もが思うところじゃないかと思います
そこに対してこれもねAIを使うとなんかまあ結構いい感じになったなっていう
やり方次第手間のかける度合い次第でもあるんだけど
まず適当に喋ります映画の感想について
もう本当に思いつくまま喋るぐらいでいいと思う
もしくはむしろ映画を見ながらドラマを見ながらの状態で
録音しておく自分の声をできるだけその状況についても伝わるような
説明的にある意味なんかナレーション的にさ
その状況を口に出しながらいやそこ行っちゃダメだとか
いやボブはもうそこなんか退職させられてしまったのかとか
わざわざ口に出すとかそんな感じにして自分の思うことも
言うみたいな感じにするじゃんそれ自体がちょっと
映画を見るほうとかに集中できないって話もあるからなんだけど
あくまで例として映画のレビューとして今話していて
いろんなことに理由はできると思うのでそんな感じでできるだけ
自分の思いとか状況を口にした上で記録をします
これは別に動画でもいいだろうし後で音声データに変換すればいい話なので
要は音声データが必要になるわけだけど
音声データを取った上でこれを具体的に
最近俺がやってるものだとGoogle AI Studio今回触れてるものに
アップロードします音声ファイルを
たぶんGeminiでもいいって思ってたんだけど
たぶんGeminiって音声ファイルアップロードできないよねきっと
って思ってたらGoogle AI Studioでいけるんだと思って
最近使ってたんだけど
とりあえずGoogle AI StudioではMP3とかアップできるので
これアップロードをしてそこでチャット欄にプロンプトして
今完全なものを伝えようとしてるわけじゃないからざっくり言うと
要は動画編集の台本を作ってっていうところ
見どころになるところをピックアップしてっていう指示をします
逆のいらないところを削除してっていう指示でもいいんだけど
そうするとたぶんポイントが増えすぎちゃったのかな
何にしても見どころ
要はちゃんとしたプロンプトはもちろん必要だ
例えばあなたはプロのユーチューバーですとか
マーケッタですとかそういうのはいつも通りの最低限の
入れた上で見どころになるところ
視聴者が興味を持ってくれるであろう
箇所のピックアップと台本を制作してみたいな
必要であればテロップの内容とかも
いろんなことができるけど
そこにするとここからこの区間だけ切り抜いて
まず最大の見どころがここですって
何秒から何秒で指定が入る
さらに映画全体の概要あらすじに関するところ
みたいなところに関してはここからここ
みたいに指定してくれます