どうも、AIコンサルターの平岡です。 AIメディア編集長のたつけです。
この番組は、AIメディアを運用する平岡とたつけが、AIを活用したい人、AIをもっと学びたい人に向けて、AI技術の最新動向や、その未来に関する情報を一緒に学び、考察する番組です。
ということで、よろしくお願いします。 はい、よろしくお願いします。
足りないよ、足りない。 何が?
週1配信じゃ足りない。 あー、なるほどね。もう情報が大量に溢れてる。
情報が。もうね、これを今話さないでどうするの?みたいなやつを全部先送りにしてる感。
あー、そうね。確かに。もう早いもんね。もう情報のなんか切り替えというかさ。 早い。
そうなのよ。AIの世界、やっぱこう日進月歩がすごいから、週1配信だと本当にダメだね。
そうね。 ギュッとしないと。
いつのニュースみたいな感じになっちゃうよね。もう週1でも。
そうなんですよ。ということでね、本日のトークテーマよろしいですか?
はい、お願いします。
はい、本日のトークテーマは、AIビッグニューストップ4。
おー、面白そうですね。
ではね、トップ4のお品書きなんですけども、まず最初がクロードですね。
あー、まあまあそうね。外せないよね、ここはね。
はい、クロードのお話をして、2つ目に空のお話をね、したいと思います。
はい。
で、3つ目に画像生成AIが抱えてた大きな弱点っていうのが2つ3つあるんですけど、
それがね、かなり克服されつつあるんだよっていうお話。
はい。
で、一番最後はデビンですね。
デビン?
デビン。これね、もう本当に今日リリースされた、リリースじゃないね、今日発表されたホヤホヤ。
あ、そういうことかね。俺も全然わからなかった、デビンって。
生まれたてホヤホヤのデビン。
おー、ちょっとじゃあ楽しみだな。
これね、かなりインパクトやばいかも。
あ、マジで?
相当やばいかも、これ。
えー、気になるな。
だからこれ最後に持ってきました。最後までなんでね。
あー、なるほどね。はい。
よかったら聞いてください。
楽しみですね。
じゃあまずね、クロード3でございますね。
GPT-4を超えたんじゃないかと呼ばれているAIなんですけども。
まず、じゃあクロード3どういったものか説明しましょう。
オープンAIの強豪であるアメリカのアンソロピックがクロード3シリーズ公開をしました。
アンソロピックっていうのは、オープンAIの元メンバーによって設立されたアメリカの人工知能スタートアップなんですけども、
クロード3は小・中・大の3サイズで展開されてて。
ポテトみたいなね。
そう、ポテトみたいな感じですね。
ポテトみたいなね。
サンドイッチマンみたいなね。
ホタテみたいな。
ホタテみたいな。
最高性能のオーパス、大のやつですね。
この大サイズのやつは、GPT-4およびGoogleのGeminiの最高位モデルの10個のベンチマークっていうのがあって、
10項目だよね、体育、数学、理科みたいなそんな感じで10個のベンチマークがあって、全てで上回っていると。
すごいよね。
だからめちゃくちゃ優秀なやつ転校してきましたみたいな。
なるほどね。
実際にこういうモデルっていくつか出てるんですよね。
Geminiの時もそうだったけど、GPT-4を超えましたみたいなリリースあって、実際使ってみたら全然じゃんみたいな。
だったんですけど、SNSの中でも評価が非常に高くて、これは本当にGPT-4を超えてるわっていう声がかなり占めてました。
そうね、そういう声やっぱ見るよね、結構。
なので本当にGPT-4から乗り換えてる人めちゃくちゃ多くて。
やっぱそうなんだ。
ぐらいすごいですね。
僕も実際使ったんですけど、日本語能力が本当に段違い、マジで。
本当にそうなんだ。
全然違う。
それ何?滑らかみたいな、自然みたいなこと?
自然、本当に自然。本当にその人と喋ってるかのようなぐらい自然。
へー、そんななんだ。
あと何だろうね、後では話すんだけど、背景を読み取ってくれるみたいな感じ。
なるほどね。
文脈を、何だろうね、きっとこういうことが言いたいんだろうなっていう察し能力が高いって感じ。
やべえじゃん、それすごいね、超気が利くね。
言語ができない内容を察してくれて、「あ、つまりこういうことですか?」みたいなっていう能力が段違い。
へー、すげえな、超優秀だな。
っていう感じですね。
なのでクロード3、何がすごいかっていうと3つあって、今お話しした日本語能力ですね。
で、実際に面白かったなって例が、2chのひらゆきさんの語り口を模倣して、桃太郎を説明してみてとか。
あー、なるほど。ひろゆきっぽく桃太郎を読ませるってこと?
そうそう、ひろゆきっぽくやってって言ったら、本当にひろゆき降臨したんじゃねってぐらい自然なものが出てくる。
へー、そうなんだ、すごいね。
あれすごいよ、本当に。
あと2chの掲示板風にGPT-4とクロード3を批評するものを作ってみてみたいな。
本当に2chの解像度超高いよ。
そうなんだ、GPTオッズみたいな。
そんな言葉使うの?みたいな。
あー、なるほどね、ネットスラングみたいなやつ。
そうそうそうそう、ネットスラングとか普通に使うのよ。
へー、すごいな。
草、草とか。
あー、だからね、日本語能力っていうか、なんだろうね、どんだけテキスト入れたんだろうって感じしてる。
うーん、なるほどね。
で、2つ目が文章力ですね。
うん。
文章の執筆レベルもやっぱGPT-4に比べて1枚上手って言われてて、
で、これね、ITメディアっていう大きいメディアがあるんですけど、
そこの記者である吉川さんっていう人が実際に制作した記事。
うん。
を添えて、これまでのAIは点と点をつなぐ能力に欠けていたんだけど、
クロード3には背景を読み取る努力が見られると述べていたと。
あー、なるほどね。
だからね、やっぱこの背景を読み取るっていう努力がすごいんですよ、クロード3は。
うーん、気になるな。
で、クロード3のすごいところの3つ目としては画像認識能力なんだけど、
これに関してはGPT-4Vにももちろんあるんだけど、圧倒的に優れていると。
GPT-4だと読み取れなかったようなものが読み取れる、特に日本語だね。
うん、日本語。
英語に関しては結構GPT-4でも読み取れたんだけど、
日本語がすごい苦手なんですよ、現状。どのLLMもね。
クロードに関しては日本語もかなり完璧に読み取ってくれて、PDFの領収書データとか、
装飾が入っているPowerPointのPDFデータとか、
そういったものをテキスト情報を全部正確に抽出するっていうのを確認できていると。
へー、なるほどね。
だから電子データの読み取りに関しては既存の最高レベルのOCR技術に匹敵すると言ってもいいんじゃないかなと。
これがなんと毎月2000円で使えると。20ドルだね。
そのOCR技術に匹敵するっていうのはやっぱりやばいことなのかな。
やっぱOCR技術一本で戦っている会社とかあるから。
あー、そっかそっかそっか。電子データを文字テキストに起こしますよみたいなそういうこと?
そうそうそう。こういうのすごいですよ。
うちのシステム使ってくださいってやってる会社が全部廃業に。
2000円でバーってやられるってことか。
あー確かにそれはやべえな。
しかもOCRだけじゃないからね。しかもそこから要約してくれたりとか。
すごい自然な文章でブログ風にしてくれたりとか。
やろうと思ったら広行き風に喋ってくれたりとか。
そんなことができちゃうのがなんと月20ドル。
あーなるほどな。
どっち使いたいですかってなったら。
エアークロード使いたいですってなっちゃう。
確かにな。そういうだってね、そういうところだけやってる会社って20ドルぐらいじゃ使えないもんね絶対。
使えないだろうね。
会社で企業で組織として何百単位のアカウントで契約とかそういうところだったりすること多そうじゃない?
そうだね。
セキュリティ云々みたいなとこがあるからすぐにはそうならないと思う。
あーそっかそっかそっか。
セキュリティが担保できれば相当コスパ良く既存の技術を全部食い荒らすんじゃないかなというクオリティでございました。
なるほどね。
すごいんですよクロード本当に。
すごいね。
第2つ目ですね。
はい。
こちらはオープンAIから発表された動画生成AIのソラ。
はい。
私たちのポッドキャストでも第1話に更新しました。
はい。
もうめちゃくちゃやべえぞと。
これはただの動画生成AIなんかじゃなくて世界シミュレーターなんだよつって。
テンション上がったもんね。
そう。マトリックスの世界が本当にできちゃうんだよつって。
もうすごいことになるぞ。もう今年やべえぞと。
うん。
あれだけ煽り散らかしましたが。
はい。
リリースねかなり先になるということが発覚してしまいました。
どうなってんだよオープンAI本当に。
もう逆転ですよ本当に。
いや本当にこれはちょっとマジでテンション下がったよな。
うん上がってない下がった。
マジでマジでテンション上がった。
テンション下がったよね。やばいじゃんよっしゃーとか言って。
なんでよ。
朝タツキからさLINE来てさおいやばいぞつって。
何?って言ったら。
えリリースされないのやばいじゃん。
ね。
ってなって。
ね。
これはね2024年3月8日に公開されたねあるポッドキャストの最新エピソードに
ソラの開発チームのリーダーが3人出演してソラに関してのインタビューを受けてた動画があったんですけど
こちらでねいつリリースされるんですかとかなり差し迫った質問をねしてたんですけど
まあちょっと一般公開は近くないかなと。
でいつじゃ出る予定ですかって聞いたけど
今年の11月何日かに実際の選挙戦だよね。
あーそうだよね。
そうそうそう。
11月になると選挙戦が終わってそれまでに
今ね物理に弱かったりとか時期率に弱かったりとかいろいろ問題があるから
そのあたりの問題を11月ぐらいまでに解決して
かつね空を公開することによってかなり技術的に職を失う方も増えちゃうので
そういった方のフォローだったりとかフィードバックとかも受けてるみたいなんだよね。
この辺がちゃんと解決されるっていうのと
あとは識別機か。
そうだね。ウォーターマークみたいなの入れるらしいよね。
その空が生成されたものだっていうものと
本物の動画っていうのがかなり区別がつかなくなってきてるから
これがちゃんと識別判別できるような機械を作ってると。
この辺がちゃんと整ってアメリカ選挙が終わったタイミングで
リリースするんじゃないかなと今予測してるので
今年の12月ぐらいかなって感じはするよね。
年末年始ぐらいかなといった感じですね。
ですので他の動画生成AIを駆使してまだまだいくらでもできるんじゃないかなと思うから。
あとなんか今日かなちょうどXで俺見てさ
ヒラ見たかどうかわかんないけどさ
オープンエアのなんか内部サイトの内部テキストかなんかの検索で
GPT4.5かなんかがどうのこうのみたいな。
見た見た。6月の中旬ぐらいに。
そうそう6月に4.5が出るみたいな感じの文章がなんかあるみたいな。
あるね。
なんかあったよね。だからなんかそういうことを考えると
6月ぐらいに4.5出ての年末に空って考えたら
こうなんていうのかな期間的になんかちょうどいい感じするよね。
確かにいい感じするよね。
いい感じするよねちょうど3ヶ月おきぐらいにビッグニュースビッグニュースみたいなさ。
そうだねそうだね。
でなんか感じはするかな。
6月頃にね結構出る可能性が出てきましたねリークとして。
ね。
まあちょっと早めに出さないとね。
クロードがかなり今やってきてるからね。
まあでも日本だけっぽいね実は。
何が?
クロードがすげえって言ってるの。
あそうなんだ。
そう。
なんで?
えっとね日本語能力だと思うんだよねおそらく。
あーだからあれかもう英語ではそもそもチャットGPTもものすごいスペック発揮してたし
で日本だけやっぱ日本語の不自然さっていうのがどうしても拭いきれないみたいなのがあったのを
クロードが解消してくれたってだけなのか。
そう。
あーなるほどね。
だから普通に英語圏の人からしたら別にGPT4でよくね。
まあ確かにちょっとすごいけどまあまあ誤差じゃねえみたいな感じなのか。
そうそうそう。
日本人からするとやべえってなるわけよ。
あーなるほどね。
だから英語圏の人が当たり前に思ってたやつがようやく俺たちも感じれるようになったみたいな。
あーじゃあ向こうの人からするともうそれぐらいのものをずっとGPTで作ってたのか。
そうっていうことなんだと思うんだよね。
あーなるほどね。
でもそれはちょっとありそうだわ。
そうなんです。だからやっぱ向こうって進んでるんだよね。
あーってことなのかね。なるほどね。
はい。ではビッグニュース3つ目。
はい。
画像生成AIが抱えていた2つの大きな弱点がね、克服されつつあるということで。
うん、なるほど。
ちなみに弱点なんだと思います?画像生成の。
えー画像生成の弱点?わかんないな。
でもなんか出たての頃に言われてたのは指とかさ、が苦手みたいなのはよく言われてたよね。
うんうん。
そうね。まあ人間の指はいまだに苦手だね。
うん。
まあ空でも6本の指の人が出てくるしね。
うん、そうそうそう。
まあ指以外でいくとテキストだね。
あーテキストね。確かに。
テキストを入れ込むっていうのがかなり苦手っていうのと、
もう1個が一貫性を保すっていうことですね。人物とかキャラの。
あーなるほどね。はいはいはい。
エンジニアが本当に必要なくなるかもしれない、デビン、登場しました。
なになに?すごいの?そんなすごいの?
これやばいよ。デビンはですね、コグニエーションラボっていうところなんですけど、
これは何かっていうと、世界初の完全自立型AIソフトウェアエンジニアでございます。
完全自立型?
完全自立型のソフトウェアエンジニア。
ソフトウェアエンジニア。
はい。このAIはですね、ソフトウェアの開発やバグの修正、
ウェブサイトの作成やソフトウェアエンジニアリングに関する多岐に渡るタスクを自動的に行うことができると。
甘噛みしたの笑いながらつつかんだ。エンジェルみたいなこと言ってたけど。
エンジェルみたいに言ってたね、エンジニアリングですね。
なるほどね。
どういうことかっていうと、バグとか出たらさ、今聞くじゃん、GPT4にぶち込んで、
どこがバグ出たと書いてもらったりとかもちろんできるんだけど、それも自動でやっちゃうっていうね。
すごい。
完全自立型なんですよ、本当に。
要は一個問題解決して新たな問題が出てきたら、それをまたやってって、往復の作業してくれるってことだよね、要するに。
そう。今まで手作業でやってたことを往復で勝手にやってくれるようになる。
やばいなもう、本当のエンジニアいらねえじゃん、これマジで。
そうなんですよね。
単一のプロンプトからコードを書いて、ウェブサイトやソフトウェアを作成する能力を持っていると。
また、自身のターミナル、パソコンに指示を出すものを持っていて、プロンプトに基づいてタスクリストみたいなのを作れるのよ、勝手に。
何からやるみたいな。
で、独自のブラウザも使うことができると。
あー、なるほど。全部持ってるのか、そのAIが。
そう。ターミナルも持ってて、ブラウザも持ってるってやばくない?
すごいよね。だって普通さ、プログラミング始めてやろうと思ったらさ、Macとかだったら別だけど、そういう開発環境をまず作るところから始めたりするじゃん。
そうだね、そうそうそう。
だからそれをもう全て持ってるわけでしょ、ブラウザからターミナルから全部。やばいよね。
おっしゃる通りで、開発環境を整えるってすごく大変なんですよ。僕今勉強してるんですけど、めちゃくちゃ難しいの、本当に。
そこでまず挫折するもんね。
挫折する、あれは教えてもらわないと。超むずいけど、それを最初から持ってるのよ、彼、デビンはね。
はい、じゃあデビンの特徴と能力をお話しすると、自律的な学習というところで、ブログを読んでソフトウェアの使い方や開発方法を理解する能力を持っていますと。
やばいよ、普通ならエンジニアがよくわかんないことをネットで調べるみたいなことやってくれるってことでしょ。
人と同じことしちゃいます。
すげーな、それすげーな。
はい、で、バグの自動修正ね。さっきも言ったけど、自分でバグを見つけて修正することが可能ですと。
で、コードの自動生成。単一のプロンプトからコードを書いてやってくれると。
他のAIトレーニングなんかもできて、他のAIをトレーニングして、自身でウェブサイトをコーディングすることができちゃう。
え、ごめんごめん、どういうことか。他のAIをトレーニングする?
そう、お前もっとこうしろって、デビンがトレーニングできるのよ。お前ここ違うからこうしろって。
え、待って待って、それは人間が唯一できるって言われたら、ディレクターという仕事じゃないんですかね。
はい、そんなトレーニングもできちゃうと、AIに対して。他のAIに対してね。
で、そっちで、そのAIに働かせてコーディングさせるみたいなそういうこと?
そう、デビン自体もコーディングできちゃう。
すげーな。
だから、超エンジニアリングに特化したAIって感じ。
なるほどね。
だからね、俺エンジニア不要論はね、そんなことないと思ってたんですけど、実際。
言うて人の仕事としてまだ残ると思ってるし。