AIメディア、MiraLab AIのたつけです。 同じくMiraLab AIの平岡です。この番組は、AIの最新動向をもとに未来を考察する
ポッドキャスト番組です。それでは本日のトークテーマお願いします。 DeepSeekで確信、これからはAIアプリの時代。
やっぱりね、皆さんDeepSeek気になってるだろうなという感じですね。 いや、本当そうですね。もうね、2025年、もうAI業界で一番ここ最近だとね、大きな
まあ、2025年でも始まって1ヶ月しか経ってないんだけど。 でもね、ここ最近だと一番大きな注目を集めているのが、まさしくこの中国初の
オープンソースAIモデルDeepSeekじゃないかなというふうに思いますので、今回はですね、前半はDeepSeekの何がすごいのかとか注意点とか
そういうのを紹介して、後半はですね、トークテーマにもあるように、オープンAIなどのAI企業への影響とか、今後はどういう方向でAI業界が動いていくのかとか
そういうのをちょっと紹介していこうかなというふうに思います。
DeepSeekっていうのが中国のAIモデルなんですけども、もともとね、V3っていうのが出て、それももう話題だよ、あったんだけど
R1っていうのが新しく出て、それを超えてきたよということで、これがね、R1驚異的な6,710億パラメーターを持つモデルというので
2025年1月時点で世界最大のオープンソースLLMっていうふうにされる規模なんだよね。
だから、オープンソースで一番大きいAIを使おうと思うと、DeepSeekになるっていうような感じだよね。
まあ厳密に言うとね、そのオープンソースではないよね、完全には。
そうね、一応便宜上オープンソースって使っても問題ないし、一般的にそう呼ばれてはいるんだけど、コードとかデータとかを全部公開してるわけじゃなくて
ウェイトとかその一部をオープンしている状態なので、厳密にはオープンソースではないんだけど、
まあまあ無料で使えるってこともあって、オープンソースLLMっていうふうに呼ばれ方をされてるって感じだよね。
DeepSeekが話題になった一番の理由っていうのは、やっぱり開発コストの安さ。
DeepSeekのモデル訓練に用意した計算コストっていうのが、わずか約600万ドル、日本円で約9億円にいかないぐらいの未満の金額なので、
だいたい580万ドルとかだよね。なのでかなり安くて、
これオープンAIのGPT-4の開発には1億ドル以上、日本円で155億円以上かかってるっていうことなので、
なのでまあもう十分の一じゃ済まないレベルで安く開発ができているという。
なのに、性能がオープンAIのO1を奪われる結果が出てるっていうところがやっぱりポイントだよね。
まあここもね、全部の開発費がそれだったわけじゃないよねっていうポイントも多分あると思うんだけど、
チップ代が含まれてないとか、前のモデルの研究費が含まれてないとか、まあいろいろあるところではあるんだけど、
ちょっとね、詐欺みたいな数字の出し方してますよね。ちょっとね、そういうところはあるけど、
ただやっぱり一応、そうは言ってもGPT-4の開発より少ないのは実際事実ではあるところではあるから、
まあ普通に考えたらちょっと当たり前なような気もしますけどね。
で、アンドリー・セン・ホロウィッツの共同創業者であるマーク・アンドリー・センさんはですね、
このディープシークの登場を米国AI業界にとってのスプートニク・モーメントと表しているということで。
聞いたことないな。
調べました。 何ですかそれ。
まあ、他国の技術的改挙を目の当たりにして競争意識が高まる歴史的瞬間。
ああ、なるほどね。
だから中国からこういうのが出てきたことによって、アメリカ頑張るぞみたいになって、
その競争環境が激化する歴史的なタイミングってことですよね。
まあでも競争は大事ですからね。
で、今回この開発コストが安かった、ちょっと疑惑的なところも若干あるところではあるんだけど、
一応明確な理由はあって、これV3のまずそもそもの開発段階で3つの技術が使われてるんだけど、これが新しい技術。
で、一つ目がMOEって呼ばれるモデルアーキテクチャーで、
これは巨大なモデルをいくつものエキスパートに分けて、入力されたデータに応じてその中の一部のエキスパートが選ばれて計算に参加する。
今回の内容はあなたでいいみたいな最適化することによって、不要な部分は休ませておくっていう方式があるんだよね。
これによって計算コストが大幅に削減できると。
ちなみにこれオープンAIのGPTモデルも同じなんだけど、ディープシークはさらに細分化してるっていうことらしいですね。
そう、かなり細かいんだよね。
で、二つ目はMLAと呼ばれる新しい注意機構で、これは文章中の単語同士の関連性を計算するこの注意機構のところですっごいメモリーを使うのよ。
で、このメモリーを簡単に言うとデータを圧縮して、その結果同じ処理を行うのに必要なメモリー容量が約半分で済むような状態になったというふうに報告されていると。
そんなことできるんだ。
そう。で、三つ目がMTPというので、これは一度に複数の単語を予測できる新技術。
要するに一度により多くの情報を学習できるから、学習速度が向上するわけよ。
だから、圧縮したりとか分割したりとか、学習速度を効率にやったりとかっていうことで、学習コストが安く済んでるところがある。
で、この技術面以外でも注目すべきポイントがGPU。
で、これNVIDIAの主力GPUのH100っていうのがアメリカから中国への輸出規制で手に入らない状態だったわけですよ。
そうですね。
なので規制前にA100っていう、わかりやすく言うとちょっとグレードが下のチップを大量に実は買い込んでいて、
その買い込んでいたA100を約1万台使って、さらにプラスもっとグレードが下のH800を2000から3000台使って開発したのが今回のディープシークのモデル。
だからさっき開発費用が安かったのってちょっと詐欺的なところあるんじゃないのみたいな話もあったけど、
このチップが含まれてないっていうのはそういうことで、もともと手にあったチップを使ったからみたいなそういうロジックがあるんだよね。
なるほどですね。
なんかでも巷では最新のチップをどっか別の国経由で買ってたんじゃないかっていう疑惑があるよな、ノースケールAIの方はね。
そうですね。
メディアでそういうこと話してたけど。
ずっと疑ってるよね。
うん。
こればっかりは調べようがないところではあるけど、ただ本当にそういうチップが手元にあるんだったら、
多分使うと思うんだよね。それはやっぱり使わなかったっていうことはないんじゃないかなっていう可能性は。
そうですね。
だからある意味、ディープシークに関しては最先端のチップがなかったからこそ生まれたイノベーションみたいな捉え方でいいんじゃないかなって個人的には思ってる。
だからこそ最新のチップを使わなくてもこんだけいいものができたっていうことで、歴史的なNVIDIAの株価が17%も急落して。
そうですね。
約90兆円が吹き飛ぶっていう事態が起きたのはこういう背景があるからだよね。
90兆ってなかなかだよね。
90兆ってね、なんか想像できないですよね。
ね。
ただね、その後すぐ回復したりとかっていうのはね、完全じゃないけどね、回復費用には載ってるってところもあって、
まだどっちに転ぶのかっていうのは読み切れてないようなところはあるかなって感じだよね。
たつけさん株買ってましたよね。
言わないでもらっていいですか。
落ちたからってね。
17%下落してすぐ買ってたよね。
そうね、個人的には全然NVIDIAがこのまま下がったままっていうことではないなって思ってるんでね、それこそロボット。
第41回のチャットGPT PROが赤字だっていう回でも、今後じゃあどこが覇権握るのかっていう話の中でさ、
NVIDIAはさ、ロボットの機関も抑えてるよって話をしたじゃん。
そうですね。
だから全然こういうことがあったとしても、NVIDIAがもう終わりだってことは絶対ないなと思ってるんで、むしろ買い時でしょっていう。
いや僕も同じく買い時だなと思いましたねあれは。
でやっぱりDeepSeekは無料で使えるので、結構手軽に使えるということで利用してる方も多いんじゃないかなっていうふうに思うんですけど、
やっぱ使う場合にはそれなりに危険性も伴うので、そこだけはちょっと理解してほしいなというふうに思ってて、
やっぱデータが中国のサーバーに保管されますし、中国政府の検閲とかも入るので、そこのリスクはしっかり承知した上で、
あとは出力が偏っているところもあって、天安門事件については曖昧な回答になるとか、
尖閣について聞くと中国の領土って答えたりとかっていうふうにかなり中国寄りの思想で作られてるモデルっていうところがあるので、
そこの出力は注意してほしいかなっていう、それこそそういうところに紐づいてじゃないけどオープンソースで無料公開してるのはデータを吸い上げるためなんじゃないかみたいな声もあるぐらいなので、
そこはちょっと確かめようがないけど、そういうのは危険だっていうのは一応認識はしておいたほうがいい。
そうですね。ただまあね、ホスティングが米国になってるようとかであれば中国行かないんで、
サイバーエージェントもね、ディープシークを使った言語モデル作ってましたけど、これもホスティングで中国行かないようになってるんで、そういうのは基本的に大丈夫っていう認識ですよね。
そうだね。あとはマイクロソフトのAzureでも今ディープシーク組み込まれたんで、
あれめっちゃ笑ったな。
そうだね。あんなにマイクロソフト感官に怒ってたのに。
そうそう。だからそれもこの使う場合の危険性の部分でちょっと紐づくとこなんだけど、ディープシークがなんでこんなに開発費が安く済んだのかっていうところで、
オープンソースのO1から出力されたデータを使って再学習みたいなのをすることによって、要はデータを盗んで作ったんじゃないかみたいな。
上流っていう。
上流っていう技術を使ってやったんじゃないかっていうふうに言われてて、それに対してマイクロソフトとかオープンエアがもう感官に怒ってたわけですよ。
勝手にうちらが予算かけて作ったやつをパクってコピーモデル作りやがってって言った矢先にAzureで導入します。
えーみたいな。
まあそれはそれこれはこれっていう話なのかなっていうね。
使うけどちゃんと調査するし、バレた時は請求するぞみたいな。そんな感じかもね。
でもまあ世に出したわけだから使えるようにはしますよみたいなね。
すごいよね。
でもだからそのAzureのモデルを使ったりとかすればある程度は安全に使えると。
ただその企業としてはね、まあそのホスティングの問題があれば平気なところはあると思うんだけど、
このディープシークがさセキュリティに対してどれくらい意識があるかとかってのがわかんなくてさ、
もう早速1月30日にデータベースからチャット履歴が約数百万件漏えい可能な状態にあったことが判明っていうニュースが出てるんで、
もう早いっす結構。
早いっすね、だいぶ。
だから結局そのオープンAIからのやつを使って上流したモデルってことは、
もしかしたら技術的にその辺のセキュリティとかが、技術レベルがそこまで高くない可能性ももしかしたらあるじゃん。
だからどこまで信用できるかわからないっていうところが結構大きいかなっていう。
確かにね。
あとこれは個人的に一番危険だなって思ったのは、
やろうと思えばバックドアみたいなのを仕掛けることができるっていう意見があって。
なんかそんな陰謀論的なこともね。
そうそうそう、でもこれは理論上本当にできるみたいで、
伴奏してくれるのがオムロンエキスパートエンジニアリングです。
ということで、第2週目も広告ありがとうございます。
ありがとうございます。
今週はですね、働く場所についてちょっとお話ししたいと思うんですけど、
結構活躍できる業界がいっぱいあるっぽいですよね。
そうなんですよね。なんか産業用機器とか、自動車関連だったりとか、
あとはね、まさしく我々がお話ししてるのは半導体集積回路関連とか。
そうですね。
多岐に渡りますよね。
もう今イケイケの半導体ですよ。
イケイケの半導体だよね、本当に。
しかも、配属先はオムロン関連会社が68%を占めるということで、
ほぼほぼ関連会社っていう感じですね。
そうだね。だからシャフだったりとか、ビジョンとかそういったものが近しいところでやれるっていうのはいいよね。
しかもあれだよね、グループ社員の仲間みたいな感じで受け入れられやすいというか、働きやすそうだよね。
そうだね。
行ってみたらすごいブラックだったみたいなことはなさそうだよね。
絶対なさそうだし、たぶん教えられ方とか、たぶんさすがに働いてないからわかんないけど、
使ってるツールとかシステムとかもある程度共通されてるものも多いんじゃないのかな、おそらく。
業界で言うとちょっと違うかもしれないですけど、確かにそうですね。
すごく働きやすそうな環境ではあるなとは思いますね。
ということでですね、もろんエクスパートエンジニアリングは、エンジニアが生涯にわたり開発現場の最前線で活躍し続けることができる、
生涯エンジニアを体現できる会社です。
エンジニアとしてのキャリア形成はもちろん、生涯エンジニアとして活躍できるフィールドと成長機会が豊富にあります。
気になる方は概要欄のリンクからぜひチェックしてみてください。
以上、おもろんエクスパートエンジニアリングからのお知らせでした。
今後ディープシークが出てきたことでどういう影響があるかというと、
まず言わずもがないNVIDIAは影響を受ける。
すでに受けてるんだけど、高性能なチップをそんなに使う必要がないっていうのをディープシークが示してしまったのは事実なので、
だから今後はそういうNVIDIAの方にお金が集まるみたいなのがちょっと鈍化するっていうのは確かにあるとは思う。
だから今回僕も株買ったってさっき話したけど、
例えばそのディープシークみたいなところに高精度のチップ渡せば普通にもっといいものできるよねっていう意見も当然あるじゃん。
だからそういう理論で考えれば最新のチップを買えるオープンAIとかアントロピックとかそういうところなんかは全然ガンガンガンガン使っていく可能性があるからまだわからない。
そこはちょっとどっちに行くかまだ読み切れないラインではあるよね。
影響が大きそうなのはオープンAIとアントロピックで、なぜかというと両方ともクローズドなモデルで月額で課金してもらって、
もしくはAPIで利用料を取ってっていうようなスタイルでお金を集めてるじゃん。
ディープシークが無料で同じレベルのを出してきてるんで、やっぱりそれで十分っていう風な流れになる可能性は全然あるよね。
まあね機密情報とか個人情報とか入れないで使えば別に十分ですからね。
そうそうそうなんかねちょっとした文章をねちょこちょこっと作ってもらうぐらいの使い方だったらさ、確かに十分だよねっていうのもあるじゃん。
でオープンAIはさO3とかさモデルのレベルで一歩前を歩いているところがあるからまだ問題ないかなっていうのはあって、
ちょっと厳しいなやっぱアントロピックのクロードさんがちょっと厳しいかなっていうところで、
元々ねAIといえばチャットGPTかクロードかみたいなツートップのイメージあったじゃん。
でも気づけばね今AIって何って言ったら多分チャットGPTかジェミニみたいなさ、なんかここがツートップみたいな雰囲気になっててさ。
そうですね。
ただでさえちょっとクロードが追い込まれている中でもっと無料でいいものが使えるとなったらそっちに流れる可能性は全然あると。
まあ視野的な話で言ったらそうかもしれないですね。
ただクロードさんに関してはあのパランティアっていうアメリカの超ビッグデータ分析企業と提携してますからね。
このパランティアが米軍全体で使用されてるんだよね、そもそも。
その米軍全体で使用されているプラットフォームの中にいわゆる今回アントロピッククロードが提携してるんで、
いわゆるクローズだからこその強みだったりとか、アメリカ企業だからこその強みっていうのもあるんで、
一概に世界全体の視野で言ったら確かに厳しいかもしれないんだけど、戦い方はちょっと変わってくるなって感じはしますね。
そうだね、今までみたいにC向けにそういうチャットベースのものでどうのこうのっていうのから戦略変更していってる可能性は全然あるよね。
で、やっぱりそのオープンソースで高性能なAIでどんどん無料化していってっていう流れは個人的には加速していくんじゃないかなとは思ってるんだけど、
ただそのアントロピックのCEOはそれに対して反論をしてて、やがてAIが安くなるっていう単純な見方は誤解で、
性能追求のための投資は続くっていう風に言ってるんだよ。
だからちょっともしかしたらポジショントーク的なところもあるのかもしれないけど、
ディープシークは米国のモデルより7から10ヶ月ほど遅れた性能のモデルをコストをかなり抑えて作っただけだみたいな。
っていうことも言ってて、だからさっきヒラもね、それは安く作れるねみたいなところあるよねって言ってたのはそういうところだよね。
高発が安く作れるのは当たり前ですからね。
真似してね、最適化されたもので作るからね。だからこそ高発の方が強いっていうのもあるんですよね。
で、2026年から2027年にはほとんどの人間より優れたAIが登場するっていう風に予想してて、
その開発にはやっぱ数百万枚のチップと数百億ドルが必要と。
その勝敗を分けるのはこの数百万枚のチップを手に入れられるかどうかだっていう風に言ってるんだよね。
なるほど。
だからやっぱ中国は今チップの輸出規制があるから、
それの進展によってはアメリカが単体で勝つのか、アメリカと中国両方が戦うのかみたいなのが変わってくるみたいな。
なるほどね。
ってことを言ってて、結構僕の予想としてはやっぱオープンソースでどんどんAIが無料化していってっていう流れかなって思ってるんだけど、
ソフィックの社長はいやいやそんなことはないよみたいなことを言ってるっていう状況。
ただインターネットの過去の歴史とか見ても、オープンソースによって無料化とともに技術がどんどん進化したっていうのはやっぱ普通にあることで。
そうですね。
それこそアパッチのHTTPサーバーとか、もうこれ今全世界の約半分が使用しているようなウェブサーバーだったりとか、
アパッチね。
あと有名なところでアンドロイドOSだよね。みんな使ってるスマホのアンドロイドもオープンソースだし、
あとは我々がメディア運営するのに使ってるワードプレスっていうコンテンツ管理システムがあるんですけど、これももう有名なオープンソースで、
確かにそうですね。
もう全世界の43%、ウェブサイトの43%がワードプレス使われてて、
まだそんな使われてるの?
今だに右肩上がりでシェアが伸びてるから。
えーそうなんだ。
そうだよそうだよ。だからやっぱりそれはオープンソースであるがゆえにっていうところ。
そういう歴史を見ればやっぱりAIもオープンソース化でどんどん無料化していく流れはやっぱりあるんじゃないかなっていうふうには思ってて。
そうそうだね。で考えるとやっぱりモデルが進化してっていう時代は一旦区切りとなった。で考えるとちょっとバカにされてるようなAIラッパーみたいなものがより一層今後は増えてきて、そっちが主流になるっていうのが個人的な僕の予測。
僕のって言ってもね、インターネット上ではそういうことを言ってる方とかも全然いらっしゃるんですけど、結構その発想が僕も近いかなっていう派閥って感じですね。
ラッパーって言うとね、僕最初に聞いたのはパワープレイシキティとか、あの辺はAIラッパーみたいな言われ方してますけど、今じゃユニコーン企業ですからね。
そうだね。でも結局ね、そのパワープレイのCEOの人もややと、オープンエンドチャットGPTだって結局NVIDIAをラッピングした企業だし、そのNVIDIAだってTSMCをラッピングした企業だし、そのTSMCだってASMLをラッピングしたものじゃないかと。
だからみんな結局何かその小さいものをラッピングして出してるんだから一緒じゃないかっていう風に怒ってたっていうのが過去に。
ゴリゴリのポジショントークだけど。
でもね、厳密に言うとNVIDIATSMCのラッピングなのかとか、確かに中身には使われてはいるけどさ。
そうね。
そこはNVIDIAじゃないみたいな。
それをラッピングと呼ぶのかっていう感じだけど、まあでも確かに一つの小さな技術を使って何か作ると。その流れで言うと、まあまあ言わんとしてないことはわからなくもないかなみたいなところがある。
そうですね。今日はそんな感じですか。
はい。
はい、それではエンディングでございます。本日がですね、収録日が2月の5日ということで、配信されるのは来週なんで、皆さんが聞いていただいているのは2月の13だと思うんですけど、
2月5日時点のことで話をすると、ディープシークがもうすごいうわーってなって、ディープシークを使った検索がすごいめちゃめちゃいいぞみたいな、推論プラス検索でやばいみたいな話をした直後にオープンAIからディープリサーチっていうモデルが出てるみたいな状況ですね。
そうですね。正直これ台本作りながらディープリサーチもすごいのになーみたいなね。
そうそうなんですよね。なんでちょっと、今ディープシークみたいな感じ。感じてる人もいるかもしれないんですけど、ちょっと配信日の兼ね合いでね。
そうそう。これちょっと理由があって、お便りでね、ディープシークについてさ、聞きたいですってお声いただいたので、それでちょっとお話させていただいたっていうのもあるんだよね。
そうですね。
ありがたいですよね、お便りいただいてね。
ありがとうございます、お便り。他にもね、いくつかお便りいただいてるんですけど、ちょっとまだね、返せてないので、Xの方でね返していこうかなと思ってるんで。
はい。
基本的には。
基本的には。
で、なんかみんなからもうディープシークやってくれよみたいなのいっぱい来たら、ラジオでやっていくとか、そんな感じでやっていきたいですね。
そうね。まあでもディープシークはね、やっぱちょっと外せないかなっていうのはあったんで。
もうね、トレンドキーワードですからね。
そうそう。
完全にね。別に再生を伸ばしたかったとかそういうことじゃないですよ。
そうね、世の中的に関心が高いっていうことね。
そういうことですね。
そう。
まあということで、来週はディープリサーチを。
これも今ディープリサーチ話しするの?みたいなタイミングになっちゃうんだけど。
ディープリサーチこそ今が一番だから。
そう、もう来週に配信したいんだけど。
確かにね。
再来週になるっていうね。今日ね、このまま撮るんで。
はい。
はい、お楽しみにしていただければと思います。
それでは最後に番組の感想をお待ちしています。
感想は概要欄のお便りフォーム、もしくはXからハッシュタグAI未来話でぜひ投稿してください。
皆様からの感想が我々のモチベーションとなっております。
またお聞きのPodcastアプリでAI未来話の番組フォローとレビューもお待ちしています。
フォローすることで最新話の通知がきます。
この番組はランギングに入る可能性が上がります。
先週はですね、最高位13位ぐらいでしたね。
ありがとうございます。
早くね、一桁いきたいですね。
皆さんフォローお願いします。応援のほどよろしくお願いします。
来週も木曜朝7時1分にお届けします。
通勤通学の30分にAIの最新トレンドをキャッチアップしていきましょう。
それでは本日もありがとうございました。
ありがとうございました。