Seeing AIの新機能紹介
はい、どうもどうも、ドリームの気まぐれ情報局、第7回目をお届けいたします。
多分7回ですよね。間違ってみたらごめんなさい。
えーと、最近わかんなくなっちゃった。
えーと、今日は、サイトワールドの話の続きするつもりだったんですけど、
また気まぐれで大変申し訳ないんですけれども、別のネタをやりたいと思います。
最近、面白いものを見つけたので、これやりたくなりました。
えーとですね、Seeing AIっていうアプリ、ご存知でしょうか。
結構有名なアプリなんで、皆さん使ってる人も多いかなと思うんですね。
書類を読んでくれたりですとか、文字を読んでくれたりとね。
それからシーンですね、風景を説明してくれたりですとか、
あと通貨を認識してくれたりとか、日本円の診察に対応してなっていうのが話題になってますけど、まだ対応してないのかな。
あの紙幣を認識してくれる機能とかですね、あとはあの光の明るさとか、あと顔なんか認識させると何歳の男性とか何歳の女性とか顔を認識して教えてくれるというそういう機能があります。
それで最近ですね、そのSeeing AIに新機能が加わりました。
まず一つ目がビデオを説明してくれる機能ですね。
これは動画とかMP4ファイルをSeeing AIに投げてやると、それを説明してくれるという機能。
それからもう一つがPDFファイルを認識してくれるという。
例えば画像のみのPDFファイルをSeeing AIに投げてやると、それを解析してOCRして読み上げてくれるという機能です。
今回はですね、このビデオを説明してくれる機能をやってみたいと思うんですね。
サザエさんの動画解析
このビデオなんですけど、時間に制限があるみたいです。
iPhoneのSeeing AIで最初やってたんですけど、動画を読ませようとしたら処理中ってなってそのまま止まっちゃって、ずっと処理してんのかなと思ってずっと待ったのに1時間ぐらい待てたんですけど全然終わんないからどうなってんのかなと思って。
試しにAndroidの方でやってみると、なんか5分ぐらい、5分の動画しか認識しないみたいなこと言うので、
iPhoneも教えてくれたらいいのに、ずっと待ってたのに、作業してんのかなと思って頑張れ頑張れと思ってたらですね、5分しか認識しないと言って、文句言ってサポってただけ。
そういう状態です。本当困ったもんですね。
5分以内の動画って何かないかなと思って、いろいろ考えてたんですけど、例えば番組のオープニングとかね、アニメのオープニングとかそういうのだったら2分とか3分ぐらいで終わるかなと思って、そういうのをYouTubeで探してみました。
そしてはですね、サザエさんの初期の動画ですね。サザエさんは1969年の10月にテレビ放映を始めたんですけども、その初期のオープニングという動画が見つかりました。
これをですね、普通に再生すると、見えないと音だけで聴いてると、単にサザエさんの曲、歌が流れてるだけなんですね。
だから今とそんなに変わらないですね。もちろんね、ちょっと違うところはあります。今とはね、なんかカラーでお届けしますとか今言わないこと言ってたりとか、ちょっと面白いところはありますけれども、基本的に音楽の鳴ってるところはほとんど変わらないんですね。
でも映像で見るといろいろ時代によって映像が違うわけです。
それを1969年の初期のビデオってどんなになってたのかなっていうのを、今からシーングAIを使って説明させてみようかなと思います。
また、55年前のフィルムの動画が最新のAIでどのように読み上げるかというのをやってみます。
ではですね、動画の方はすでに準備しましたんで、今から解析いきます。
元のYouTubeの動画のURLは説明のとこに貼っておこうかなと思ってます。
ではでは、元の動画はそっち見てくださいね。ではね、やっていきますね。
これね、実際1分ぐらいしかないんですこの動画。1分ちょっとですね。1分4秒だったかな。3秒か4秒ぐらいしかなかったですね。
解析結果と個人的感想
ではこれをね、今ファイルアプリで見てるんで、上下スワイプで。
これね、共有。ここでダブルタップ。
そしたらいろいろ出てくるんで。
ビーマイアイズで解析なんてするんかね。
これこれ、このSeeing AIでの認識。ここでダブルタップします。
そうすると、
こんな感じで解析するんですね。これすごい時間かかるんですよ。1分ぐらいしかないのに。
これ待ってたら退屈なんで、この後は編集でカットしますね。はい、では動画始まるところからいきます。
ダブルタップ。
キャラクターが画面の横から覗いているのが見え、さらにテキストクレジットが表示されます。
画面に赤い星が表示され、テキストクレジットが表示されます。
カートを引いているキャラクターが示され、後ろに長い赤い線が引かれています。
キャラクターがカートを押し、笑顔で元気に見えます。
キャラクターの頭のてっぺんは、画面の下から覗いているように見えます。
キャラクターが編物を押し、毛糸のボールを持ち、満足そうに微笑んでいる様子が描かれています。
同じシーンが続き、プラットフォーム上のキャラクターと近くにいる二人の子供がいます。
プラットフォーム上のキャラクターの周りには、年配の男性と女性を含むキャラクターのグループが集まっています。
キャラクターのグループは画面に残り、その下にテキストクレジットが表示されます。
いくつかのキャラクターが別々のフレームに表示され、それぞれが異なる表情とポーズを持っています。
キャラクターのグループが一列に並んで歩いており、背景にはトウシバのロゴが見えます。
トウシバのロゴの横には、笑顔で立っているキャラクターがいます。
キャラクターは、目立つように表示されているトウシバのロゴに面しています。
キャラクターは、トウシバのロゴと追加のテキストの前に腕を広げて立っています。
キャラクターは、トウシバのロゴとテキストを背景にして、嬉しそうに腕を上げています。
キャラクターは、トウシバのロゴとテキストの前で興奮してジャンプしています。
はい、ということで、いかがでしたでしょうか。
えーと、なんか、えー、
わざわざいちいち動画止めて説明してるってとこが、なんか、笑
ちょっと、どうかなってきましたしね。
えーと、解析、えー、そうですね。
えー、1分ぐらいの動画だったんですけど、だいたい解析にですね、えー、
3、4分ぐらいかかってたと思います。
えー、それから、あの、わざわざ止めて説明するので、
もう1分の動画見るのに、なんか、2、3分ぐらいかかっちゃいますよね。
えー、どうですかね、えー、
まあ、個人的な感想としてはね、わざわざ止めて説明しなくても、
いいんじゃないかと。
あの、最初、テレビの複合声みたいにこう、あの、
元の動画が流れて、それにかぶせてこう、説明してくれるのかなと思ってたんですけど、
わざわざ止めちゃってないですね。
うーん、
例えばね、説明してほしいなとかね、
このシーンどうなってんのかなと思ったときに、
こう、なんか説明する、なんか、
説明してくれるみたいな方が、
使いやすいんじゃないかなというのが、個人的な感想です。
どうですかね、皆さん、あの、複合声とか、
テレビの複合声とか。
個人的には、まあ、あの、
できるだけ、この、元の、
セリフとかね、交換音とか、元の動画の音声にして、
あの、説明してくれる方が、
セリフとかね、交換音とか、元の動画の音声に集中したいんで、
あんまり、その、複合声、
うるさく言ってほしくないかなというのは、
思ってるんですね。
まあ、あの、
音声じゃなくて、例えば、
展示で、とかね、別のチャンネルで表示するとか、
なんか別のチャンネルでやってくれた方が個人的には嬉しいんですけども、
あんまり、あの、
うるさく動画にかぶせてほしくはないかなという、
必要な時だけやってくれたらいいかなと思ったので、
ちょっとこれは、確かに条件は分かるというか、
うん、条件はいろいろ説明してくれて面白かったんですけども、
ちょっと実用という点で、これで、なんか映画を見るとか、
うーん、なんかテレビを見るとかっていうのは、
すんごくなんか、うーん、余計なこと言いすぎるかなという気はしましたね。
はい、ということで、
みなさんはどのような感想を持たれましたでしょうか。
なにこんな面白い機能もあるので、今後ね、また、
改良されていくといいかなと思います。
それでは本日はこの辺にしたいと思います。
次はサイトワールドできるかな。
わかんないですけど、はい、いきますね。
またやりますね。
はい、ではまた。ごきげんよう。さようなら。