2022年12月の人工知能AIについてのニュースやノウハウをPodcastラジオ配信で振り返る

00:01

皆さん、こんにちは。ネットビジネスアナリスト横田修琳です。

月1回のポッドキャストの時間となりました。

今日もですね、2022年12月に公開されました人工知能AIに関するニュースということで

紹介していきたいと思いますので今日もよろしくお願いします。

今日はですね、年末ということもありますので

ちょうどこの1年間を振り返ってみるニュースなんかもですね

紹介していきたいなと思っていますのでよろしくお願いします。

ではですね、早速なんですがまず今日お話ししたい内容っていうのは

人工知能に関するニュースというものと画像認識技術に関するニュース

顔認識に関するニュースそしてフェイク動画やディープフェイクに関するニュース

そして音声などに関するニュースということでお話をしていきたいと思っているんですが

この中の最初のとこにあるですねここの話なんですけど

ちょっと見てほしいなと思うんですがこの画像認識技術に関して

少し振り返ってきますと2014年にですねこの画像生成モデル

Ganttやつが開始になりまして 2018年にオープンAIがGPT-1を発表して

そして2018年にGoogleはBERTを発表して翌年の2019年にオープンAIがGPT-2

そして翌年の2020年にGPT-3を発表して 2021年っていうのは

ちょっと大きいニュースはなかったかなって気はしているんですが

それが今年に入って2022年の5月に Googleが画像生成

オープンAIがですね 4月に画像生成AIのですね

DAR-E2というものをですね発表しましてそしてその翌月の5月に

Googleが画像生成AIのImagineというものを公開してそしてここからなんですよ

今年の7月にミッドジャーニー画像生成AIですね公開

そして8月にステイブルディフュージョンそして9月にオープンAIが

構成の文字起こしAIのウィスパーを発表そして10月には

ノーベルAIディフュージョンが公開といってですねこの7,8,9,10年代に

画像生成AIってものがどんどんどんどん出てもっとたどれば4月からですね

出てきてですねこの急激にこの画像生成AIが注目された

今年なんですがそれが12月に入ってですねまた同じくオープンAIが

GPT-3を改良したAIチャットボットの ChatGPTというものを公開して

これで偉いことにはなっていますということなんですね

今日はですねこの話をねちょっとしていきたいなと思ってるんですが

この画像生成AIっていうものが非常に注目された1年なんですが

今度はですねこれの中で注目的存在であった

ステイブルディフュージョンというですねもの

これはStability AIという会社が出しているものなんですけど

ここがですね 12月に画像生成AIに続いて

03:00

今度は動画生成AIをですね開発するということが

発表になりましたで同じくオープンAIはですね

今度はテキストから3Dモデルを高速生成できるAIの

ポイントEというものをですね発表したりとかしていて

今度はチャットとか文字から画像を生成する

というレベルではなくて今度は3Dモデルとか

動画とかですねこういったものを作っていくということができる

になってきたということでこの1年のですねこの進化のスピードが

非常に速くなっていますということで今までは2040年にですね

そのいわゆるシンギュラリティが来るって言われてたのが

続いてみればもう2025年に来るんじゃないかというふうにですね

この1,2年のですね進化のスピードが恐ろしくですね

シンギュラリティが来るって言われてるのはなんとですね

もう今年年末ですからあと2年 2025年に来るというふうに

言われていてですね恐ろしいことになってきてるよということなんですが

ここでですねちょっと僕が話をしておきたいのは

このチャットGPTが12月に出たばかりなんですけど

これはいわゆる文字を打ったら文字に対してAIがですね

チャットで返事を返してくれるっていうものなんですね

ただそれだけのものかなと思っていたら

それがですね例えばこういう写真を見せてとか

こういう動画を作ってとかこういうプログラミングを見せて

とかってやっていくとプログラミングの言語をですね

ソースとして吐き出したりとかするようになるので

そうするともうプログラムも作れる AIも作れる

AIというかアプリも作れるそしてウェブサービスとかも作れる

動画も作れる音楽も作れるっていうふうに

もう本当になってくると思います

これが2025年までにおそらくもうなっていると思うんですね

そうなってくると結局ですね

クリエイティブな仕事は AIは苦手だと言っていたものが

できるようになってきたんですよ

この画像認識技術とか音声認識技術とかですね

顔認識技術みたいな今までは認識技術ってことに関して

僕はですねたくさん話をしてきたんだけど

この認識技術のレベルを今度超えて

自分たちが生成する合成するってことが

できるようになったのがこの1年だと思うんですね

つまりインプットの時代からアウトプットの時代に

入ったということなんですね

これによってですね分かりやすく言えばね

赤ちゃんが最初は自分はアウトプットできないわけですね

つまりしゃべれないわけなんだけど

それがみんなの声を聞くことによって

インプットがある程度できたらアウトプットを始めますよね

最初は下手くそな日本語だったりとか

下手くそな絵を描くんだけど

だんだんそれが上手になってくるように

今まさにインプットからアウトプットの時代になった

もちろんアウトプットの時代になったからインプットやめたくじゃなくて

インプットもどんどんしていくわけなので

どんどんアウトプットのレベルが上がっていくというステージに

入ったのかなという気がしていますね

なのでようやくこれでですね

しゃべれるようになった絵を描けるようになった

歌を歌うようになったっていうとこまでね

AIが来たということは分かると思うんですね

06:00

そうなっていくとどうでしょうかね

1歳2歳3歳ぐらいまで来たかなと思っているんですね

そうすると今度ですね歩くようになるみたいな

歩けますしね二足五歩で歩けますしね

ってことになってくると

これからどんどんスピードを持って進化していくと

この後ですねさらに次に進むのは

自分から自ら勉強するとかですね

いわゆる意識とか意思っていうものを持ち始めるとですね

いわゆるシンギュラリティに突入するんじゃないかな

っていうことなんですがこれが多分

あと2年後ぐらいにそうなってくるんだろう

ということなんですね

この中で大事なことって何かってことになると

例えばですねどういう写真を見せてとか

どういう絵を描いてとかどういうアプリを作ってとか

どういうデザインを作ってみたいな感じで

支持するものって文字で支持するわけです

もちろん文字っていうのは音声ですることにも

これからなってくると思うんですが

現時点ではテキストレベルなんですが

実際にテキストレベルであろうが

音声レベルであろうが

結局言語を使って説明するっていうことなんですね

なので今までだって例えばデザイナーさんとか

写真家の方とかウェブのデザイナーさんとかに

お願いするときにこういうものを作ってね

ってお願いするときには言語を使って

支持してるはずなんですね

それは文字なのか音声なのか

そのときの何かとりあえずいいの作って

って言ったんではいいの作れないけど

こういう感じでこういう感じでっていう形で

それが具体的に言えば言うほど

向こうの人はそれを理解してですね

返してくれるってことができると思うんですね

でなってくるといかに

今の画像生成AIの言葉で言うと

この呪文ですね

どういう呪文を AIに教えればですね

よりこう正確なアウトプットをするか

っていうことをですね求められるようになってきた

っていうのは結局この

人間の教育もそうだし

AIの教育も同じなんだけど

どういうふうに上手に教えるか

どういうふうに上手に指示するか

っていうことが大事になってくるんじゃないかな

と思いますのでそうなってくるとですね

言語が大事だよねっていうことになるし

もちろんね AIは日本語が喋れない

日本語を理解できないもいるから

そのレベルでまずは英語でね

話すほうが当然世界の人が

使ってるわけなので

重要だってことも言えるし

そして今度は

より分かりやすく伝えるってことが

大事になってくるかなと思っています

そして AIからそのうちですね

提案が来るようになると思うんですよ

あなたはそういうふうに言ってるけど

ということはこういうことなんですかとか

それよりもこういうふうにしたほうがいいんですか

っていうことですね向こうから今度は

指示するようになってきたら

それに対して皆さんが

その指示された内容がいいかどうか

判断するかどうかっていうのも

皆さんがそこでですねどう答えるか

それがAIの思うままに

あんたの好きなとおりにさせてよ

っていうのが本当にいいのか

これはデザイナーでも一緒ですよね

クライアントから何か作っていったら

いやいやもうあんたに任せるよっていうので

本当にいい作品が作れるのか

いやそれはやっぱクライアントさん側のですね

意向をちゃんと言わなければ

09:01

ちゃんといいもの作れないのかって考えてもらえば

分かると思います同じ話ですよね

なのでそのAIっていうものに対して

今まではですね

例えばGoogleなんかで言えば

検索をして検索結果を出す

ということをやってたわけなんですけど

検索結果を出すのはAIがすでに出してますよね

検索結果を出したら

ウェブサイトが出てきて

そのウェブサイトをGoogleとかクリックして

ウェブサイト見に行くってことをしてるわけなんだけど

ということはこのChatGPTみたいなのが出てきたら

検索結果を出すってことが

できるわけじゃないですか

だってGoogleで検索して検索結果出すように

ChatGPTも同じように検索結果出すわけですよ

そうなってくると

Googleがですね

ChatGPTが12月に出たからと言って

別にGoogleは特にこういうことは

気にしないよって言ってたのに

その発表をしてもう1週間経たないうちに

Googleはまた発表しましてですね

これは世の中を変えることなんかしないので

Googleとしてもですね

自分たちもChatGPTみたいなものを作るということを

発表しました

ということでGoogleがですね

初めてじゃないかな

自分たちのサービスにおいて危機感を感じた

検索っていうサービスが終わるかもしれない

ということに危機感を感じた

そうですよね

変な広告とか出ないわけですよChatGPT

もちろんね

これからマネタイズをしていく段階になった時に

航空が出てくるということもあるかもしれませんが

もちろんそれに対してですね

お金を払えばですね

変身の中に航空が入るみたいなことも

あるかもしれませんけど

結局それはGoogleがやるのか

このオープンエリアがやるのか

ということも含め結局はこれは

マネタイズの話になってくだけなんですが

ということでGoogleもですね

動き始めたっていうのが

本当に1ヶ月の話で

結構重要なニュアンスかなって

気がしています

今回まとめということで

ここを見てもらったら

一目瞭然なのかなって気がしてるんですけど

画像生成AIが出てきて

今後は動画生成AIが出てくるでしょう

そして音声の生成AIも出てますよね

ということになっていくとですね

いよいよこれからかな

という気がしています

ということで

2023年はですね

おそらくこのまさに

インプットからアウトプットの時代に

突入するということになりますので

これに関してですね

一つスレッドを立てなきゃいけないのかな

と思っています

現時点に作っているこのブログの記事の

随時更新ネタっていうのは

どっちかというと認識レベルの話とか

ものが多かったんだけど

今後はこれだけではなくて

今度はですね

自分たちが生成するレベルの話の

コンテンツを作らなきゃいけないかなと思っています

ということで今日はですね

今月のニュースをお届けするっていうよりは

ちょっと今年1年間を

振り返ったニュースを見てきました

もし詳しいニュースを見たいという方は

概要欄などに

ニュースの一覧のリンクを

貼っておきますので

ぜひそちらのほうからまた見てですね

12月分振り返っていただけばいいかなと思っていますので

よろしくお願いします

ということでですね

2022年最後のポッドキャストとなりましたが

また来年も

12:01

続けていきたいと思っていますので

引き続きよろしくお願いいたします

ネットビデオアナリスト横田修林でした

ありがとうございました

バイバイ

スター

エピソードをシェアする

メッセージを送信

横田秀珠（新潟ITコンサルタント）

スター

コメント

こちらもおすすめ