スマホで読唇、言葉推測 人工知能AIを活用したシステム公開 九工大・斉藤准教授

--- Send in a voice message: https://podcasters.spotify.com/pod/show/enspire/message
00:00
皆さん、こんにちは。ネットビジネスアナリスト、横田秀霖です。
今日も人工知能AIについて、3分で考えていきたいと思います。
以前にも、もしかしたら紹介したことがあるかもしれませんが、独身術というものがあります。
唇の動きを読んで、相手が何を言っているかということを判断するという技術があります。
この独身術というものは、今まで専門家がそういう能力を持っていて、見抜いていたものがAIによってできるようになった。
しかも、AIの方が人間よりも精度が上がってしまったことによって、もうこの部分に関しては完全にAIが勝った状態になっているわけです。
今回のニュースであったのは、スマートフォンのアプリで実現した、つまりカメラを撮影して、実際に唇の動きを撮影したものを動画配信すると、
その情報をAIが受け取って、それに対して何を言っているかというのを判断することができるようになったというものですが、
まだまだ技術が低くて、一部の言語だけでも70%ぐらいなので、まだまだ全然実用化まではいかないのですが、
この辺も画像認識技術の話なので、いずれ近い将来実現してくるのではないかと思いますが、ここまで来ていると。
僕はよく、前もお話したかもしれませんが、今までは音声入力というものが流行っているけど、これからは音声入力ではなくて、
口パク入力になるよと。つまり、読心術をスマートフォンが認識するのであれば、今、顔認識、iPhoneの中でもありますように、顔認識をカメラがずっとしているわけですよね。
それであれば、カメラが口で動いている動きを、口パクをちゃんと読み取れば、読心術のように文字を入力していくことができるようになると。
だから、実際に歌なくても喋らなくても、口パクするだけで入力するということができるんじゃないのということを冗談で言っていたことがあるのですが、
これが本当に現実になってきた話が、今回のニュースではないかなと思っています。
いつも僕が言っていることですけど、人間ができていることは、いずれ永遠にできるようになると。
それをできるかできないかは、技術が追いつくか追いつかないかという問題だけであって、技術的にはできるんだということを話していると思うんですが、
まさにここのジャンルにおいても、そのことが言えるんじゃないかなというふうに思っています。
ということで、まだまだなんですけど、これを賢くしていくためにはどうすればいいかというと、
その口パクを読み取って、何を言っているかをわかるみたいなアプリとか、そういったものを作っていかなきゃいけないんですね。
だから今、音声入力しているものはマイクだけで入力しているんだけど、これをカメラモードみたいな形で入力していく仕組みを作れば、
03:06
口の動きなんかも今度、学習していくことができるようになるので、そうするとかなりの情報を得られるんじゃないかなと思いますね。
ネットベースアナリスト、横田修林でした。ありがとうございました。
ではまた明日。
03:19

コメント

スクロール