2025-12-07 05:18

TikTok(CapCut)ロング動画やライブからショート切り出し新機能「Smart Split」の頭脳、その正体と挫折譚 ByteDance Vidi

https://koukichi-t.com/archives/47555 / ※掲載リンクはアフィリエイト広告を含む場合があります。今日はちょっとマニアックだけど、動画クリエイターなら絶対知っておくべきByteDanceの最強AI「Vidi」について深掘りしていこうと思います。 以前、ポッドキャス...続きを読む
投稿 TikTok(CapCut)ロング動画やライブからショート切り出し新機能「Smart Split」の頭脳、その正体と挫折譚 ByteDance Vidi は KT⚡️Tech & Life ( https://koukichi-t.com/ )に最初に表示されました。
✅️まとめ:YouTube収録/ポッドキャスト/ライブ配信関連機材
https://www.amazon.co.jp/shop/kt.pics/list/KUI7D4JMYJF6
✅️使用アプリなど
音声編集:Adobe Audition
https://prf.hn/l/eOz1Vdo/
動画編集:Adobe Premiere Pro
https://prf.hn/l/0eQV8V1/
全部入りCreative Cloudが50%オフ!4/4まで
https://prf.hn/l/G9Ja5D5/
--
✅️買ったやつ。ガジェット関連まとめ
Amazonインフルエンサーストア
⁠⁠https://www.amazon.co.jp/shop/kt.pics⁠⁠
✅️関連SNS
ブログ
⁠⁠https://koukichi-t.com/⁠⁠
Twitter(X)ポッドキャスト用
https://x.com/kiku_matome
Twitter(X)中の人
https://x.com/Koukichi_T
✅️YouTube
ガジェット本音レビューチャンネル
https://www.youtube.com/channel/UCZzl7IurT1V8-HPrF0S07GQ
SNS関連情報チャンネル
https://www.youtube.com/channel/UCkDwn4gZY8VYHAxCkHynTWw
--
※アフィリエイト広告リンク含みます⁠

サマリー

TikTokの新機能「Smart Split」は、ByteDanceのAI「Vidi」によって長尺動画を自動的に短く編集する革新的な技術です。Vidiは動画の内容を深く理解し、ユーザーの指定がなくても適切に編集を行う能力を備えています。

Smart SplitとVidi
TikTok、CapCutロング動画やライブからショート切り出し新機能、Smart Splitの頭脳、その正体と挫折譚 ByteDance Vidi。
今日はちょっとマニアックだけど、動画クリエイターなら絶対知っておくべき、ByteDanceの最強AI、Vidiについて深掘りしていこうと思います。
以前、ポッドキャストで、TikTokの新機能、Smart Splitがすごいって話をしたの覚えてる?
CapCutには、もともとあった長尺動画を自動で、ショート動画に分割してくれる機能。あれが、TikTok本体にも実装されたって話。
で、今回のメインテーマは、その裏側にいるバケモノAIの話です。その名も、Vidi。
一言で言うと、動画の内容を、人間並みに、あるいはそれ以上に理解して、勝手に編集までしちゃうAIです。ここがヤバいよVidiさん。
ByteDance、TikTokの親会社が開発した、このモデル、ただ動画を見てるだけじゃありません。
時間と場所の完全特定、スペシオ、テンポラルグラウンディング。
普通のAI、この動画のどこかに、犬がいる。
Vidi、開始3分20秒から45秒の、画面右下の、この座標に、犬がいる。
ここまでわかってるから、縦型動画への自動リフレーム、切り抜きが完璧にできるわけです。
文脈を読んだ、ハイライト抽出。これが、スマートスプリットの正体です。
面白いところや、オチを理解して、何も指示しなくても勝手に切り抜いてくれます。
30分以上の長尺動画も一発で、処理できるのが強み。これ、他の技術だと結構難しいんです。
つまり、カプカットやTikTokで、我々がお世話になっているあの便利機能、その中身こそがこのVidiだったというわけ。
Vidiの実力と試行錯誤
2、実力、Vidiを、ローカルで動かそうとして玉砕した話。
さて、ここからは、失敗談。
そんなにすごいAIなら、俺のPCで動かせば、最強じゃん?って思うよね。俺も思った。
で、相棒のAIエージェント、アンティグラビティと一緒に、このVidi、正確には、オープンソース版のVidi-7Bを、ローカル環境で動かそうと試みたわけです。
挑んだ環境。
Windows PC、WSL2環境。
そこそこ強いGPU。
結果、惨敗。
いやー、きつかった。まず、環境構築の難易度がえぎい。よくわかってない。
以下は、過剰書きは、AIと進める中で起きたことなんだと思う。
フラッシュはテンションが入らない。
WSLの依存関係で無限にエラーが出る。
やっと動いたと思ったら、クーダーアウトオブメモリー、メモリ足りねーよで落ちる。
結局、Googleコーラボ、クラウド上の超強いマシンを使えば動くことはわかったんだけど、
自宅のPCで、さくっと、全自動動画生成という夢は、一旦お預けになりました。
教訓。
Vidiは、一般人が手元で飼うペットじゃなくて、バイトダンスの巨大サーバーという檻の中でこそ輝く、猛獣でした。
素直にTikTokやカプカットの機能として使うのが、現時点では一番賢いし、早いです。
3、まとめ、Vidiはどう使うべき?
今回の調査と実験でわかったことはシンプルです。
Vidiは、動画理解AIの最先端であることは間違いない。
TikTokスタジオやカプカットのスマートスプリット、自動分割の裏側には、
このVidi、または、その発展版がいる可能性が、極めて高い。
ローカルで動かすのは、シュラの道、エンジニアレベルの知識と、モンスター級のGPUマシンが必要。
結論。
中身を知って、ツールとして使い倒そう。
裏でこんなすごいAIが動いてるって知ってるだけで、ツールの使い方が変わる気がしない。
あ、今Vidiが俺の動画解析してるな、って思いながら、スマートスプリットボタンを押すと、ちょっと愛着が湧くかもしれません。
もし、どうしてもローカルで動かしたい、っていうもさがいたら、
Googleコーラボのプロプラン契約してから挑むことを、強くお勧めします。
俺みたいに時間を溶かさないようにね。
このブログ記事は、AIエージェントと共に、リサーチ、執筆、画像生成を行いました。
TikTokVidiバイトダンスAI動画編集、動画生成AIカップカットスマートスプリット、クリエイターテックトレンドAI活用。
05:18

コメント

スクロール