DeepSeekの紹介
皆さんこんにちは、矢野哲平です。この番組は、耳で学ぶAIをコンセプトに、初心者・中級者向けにAIを分かりやすく解説する番組です。
今回のテーマは、DeepSeekって何者ですかについて話していきます。はい、ということで今日はDeepSeekについて話していきたいと思います。
皆さん、DeepSeekは使ってみましたでしょうか。 DeepSeek使ってみたよという人もいれば、いや、DeepSeek初めて聞いたねという人も多いと思います。
DeepSeek、簡単に言うと中国の企業が開発したAIですね。 前回のポッドキャストで、DeepSeekを実は取り上げようと思っていました。
ただ、オープンAI、ChatGPTがO3 miniや、あとはDeep Researchという機能を発表したので、前回はですね、一旦ChatGPTの話をしようと思いました。
今回、DeepSeekをなぜ話すのかというと、理由としてはかなり話題になっているからですね。 最近は結構メディアでもDeepSeek取り上げられています。
ちょっと私、びっくりしたんですけど、うちの母もDeepSeek知っていたんですね。 私、普段テレビを見ないんですけど、結構テレビのニュースでも一時期取り上げられてたんですかね。
うちの母親はテレビのニュースで知ったというふうに言っていました。 なので、DeepSeekを使う使わないは別として、かなり話題になっているので、
今回のエピソードでDeepSeekに関する情報というのを一旦整理しようかと思います。 今日話すポイントは主に3つです。
そもそもDeepSeekって何ですかという話ですね。 2点目にDeepSeekの使い方や注意点。
そして3点目にDeepSeekについてもう少し掘り下げた内容、 創業者やDeepSeekが目指しているものなどについて話していきます。
はい、では早速話していきましょう。 そもそもDeepSeekって何者ですかという話からですね。
これ簡単に言うと、冒頭でも少し触れましたけど、中国の企業が作っているAIとなります。 最近結構いろいろなところで話題になっていますよね。
で、なんでこんなに話題になっているのかっていうと、最近このDeepSeekがDeepSeek R1というモデルを発表したからになります。
で、これがいわゆる推論モデルというふうに言われていまして、 ChatGPTのO1モデルと同じぐらいの能力を持つというふうに言われています。
これだけでもすごいことなんですけど、DeepSeekってオープンソースのモデルなんですね。 なので誰でもDeepSeekのモデルを自分の環境で使うことができると。
例えば私が自分のパソコンにDeepSeekのモデルをインストールして使うことができると、オフラインで。
一旦マシンの性能というのは脇に置いてですね。 やろうと思えばそういうこともできると。
で、これっていうのはMetaと同じなんですね。 あのマーク・ザッカーバーグが経営するFacebookやインスタグラムの会社ありますよね。
Metaの会社。 で、このMetaもLamaというAIモデルを開発していまして、このLamaもオープンソースで開発されています。
じゃあオープンAIはどうなのという話ですけど、 オープンAIは現時点ではオープンソースではないですね。
なのでChatGPTを使おうと思ったら、オープンAIのサイトにアクセスをするか、 もしくはAPI経由で利用する形になります。
なのでLamaやDeepSeekのように、自分の用意した環境にChatGPTをインストールして使うと、 そういった使い方は現状できないわけですね。
ちなみにDeepSeekは逆にChatGPTのような使い方もできます。 DeepSeekの公式サイトにアクセスをするとチャット画面があります。
ChatGPTと同じようなですね。 その画面でAIと会話ができるというわけです。
これ以外にもAPIも用意されているので、 API経由でDeepSeekも使うことができるというわけです。
ちょっと話を戻すと、ちょうど先月ですかね 1月の20日にDeepSeek R1というモデルが公開されて業界に激進が走りました。
中国のAI企業がChatGPTのR1モデルと同程度の性能のモデルを出してきたと。 しかもオープンソースでと。
さらに言うとAPIの価格がかなり安いと。 これが結構業界で話題になったというわけです。
ちょっとオープンAIとDeepSeekのAPIの価格の違いっていうのを比較してみますね。
O1モデルとDeepSeek R1のモデルでちょっと比較をしてみます。 100万トークンあたり出力トークンの価格で言うと、まずO1
オープンAIのものが60ドルとなります。 100万トークンあたりアウトプットのトークンの価格が60ドルですね。
でそれに対してDeepSeek R1が2.19ドルです。 60ドルに対して2.19ドルなので約30分の1くらいの価格で
O1モデルと同程度の推論モデルが使えると。 これがですねかなり衝撃的だったわけです。
しかも中国ってAIの開発に使われる半導体の輸出規制を受けているんですよね現在。
でそういった輸出規制などの制約がある中で中国のAI企業がすごいのを開発してきたぞと。
というわけで話題になったわけです。 ちなみにアメリカでも日本でも結構騒がれまして
IT系の企業の株価が落ちたりしました。 ちょっとしたDeepSeekショックみたいなことがあの起きました。
安全性と利用状況
前回のエピソードでOpenAIの新しいモデルのO3 miniについて話をしました。
このO3 miniもAPIの価格っていうのが従来よりかなり安く設定されました。 このO3 miniの発表っていうのがDeepSeek R1の発表の後だったので
もしかするとですねOpenAIはDeepSeekの価格を意識して O3 miniの価格も下げてきたのかなと思いました。
あのモデルの価格が下がるのはユーザーとしてはありがたい話なんですけどね。 でこのDeepSeekなんですけども誰でも使うことができます。
DeepSeekのサイトにアクセスをしたらChatGPTと同じようにチャット画面があります。 そこから利用ができると画面もですねほとんど同じような
構成なのでChatGPTを触ったことがある人っていうのは問題なく利用できると思います。 でこうチャットボックスの下にR1とかあとは検索のボタンがあるんですね。
でこのR1のボタンを押すとChatGPTのO1モデルと同程度の性能を誇ると言われている DeepSeek R1を無料で使えるというわけです。
でChatGPTのO1モデルって現時点では無料ユーザーは利用できないですね。 有料ユーザーから利用できるモデルとなります。
なのでそれに相当するモデルがDeepSeekでは無料で利用できると。
O1のような高性能な推論モデルを使ってみたいという人はですね DeepSeekを触ってみるのも面白いと思います。
ちなみに検索機能もあるのでAI検索としても使うことができます。 でちょっと前後するんですけど一応DeepSeekはですね
中国語と英語に対応しています。 じゃあ日本語でのやりとりができないのかっていうとまあそういうわけではないですね。
日本語でも全然やりとりはできます。 ただ精度としては中国語や英語には若干劣る点があると。
あのこの点だけですね抑えておきましょう。 ただ問題なく日本語でも利用できます。
こんな感じで無料で高性能なモデルを使えるだけでもありがたいわけなんですけども DeepSeekはですねちょっと別の面でいろいろ議論されている側面もあります。
でそれが安全性の問題ですね。 中国企業が開発したDeepSeek危ないんじゃないのというふうに言われています。
まず先に言うとDeepSeekのチャット画面に入力した内容っていうのは AIに学習される場合があります。
これはですねChatGPTやGemini、クロードでも同じとなります。 チャット画面に入力した内容っていうのはAIに学習されるケースもあると。
なので企業の情報とかあとは個人情報は入力しないようにしましょうねと。 これはAIを使うときによく言われることですね。
次にもう一つのパターン。 DeepSeekのAPI経由で入力した場合、実はですねこれもAIに学習される場合があると規約に書かれています。
ここが他のAI企業とはちょっと異なる点なんですね。 例えばChatGPTをAPI経由で利用した場合、その内容というのはAIに学習されませんよと
オープンAIの規約に明記されています。 ただDeepSeekはAPI経由で入力した内容もAIに学習される場合がありますと
規約に書かれています。 こういったこともあってDeepSeekは危険だという意見も多いです。
あとは中国企業が開発したAIという点もニュアンスとして含まれているのかなと思ったりします。 ただ一方でDeepSeekを導入する企業っていうのは増えています。
一番わかりやすい身近な例で言うとパープレキシティ。 あの検索AIのパープレキシティですね。
このパープレキシティは割と早い段階でDeepSeekをAIモデルとして導入しています。
パープレキシティが最近出したAPIのモデルでソナーリーズニングというモデルがあります。 これは内部でDeepSeekの推論モデルが使われているというモデルになります。
パープレキシティのCEOのXのアカウントとか見ると結構批判的な声も書き込まれているんですね。
危ないと。なんで中国のモデルなんか使うんだと。 でその度にパープレキシティ側は丁寧に説明をしているんですけどちょっとですねここら辺の情報が
複雑になっている気がするので一旦情報整理したいと思います。 先ほど説明したようにDeepSeekのチャット画面とか
あとはAPI経由で入力した内容っていうのはDeepSeek側に学習される可能性があります。
これは他のAIでも似たような感じなんですけど確かにこの場合っていうのは会社の 機密情報とか個人情報の入力には注意する必要があります。
ただパープレキシティの場合はちょっとこのケースに該当しないんですね。 これをちょっと詳しく説明するとパープレキシティのプレスリリースとかにも書いてあるんですけど
ちょっと読みますね。我々が使っているDeepSeekのモデルはアメリカのデータセンターにホストされていますよと。
つまりDeepSeekのAPIを使っているわけではなくて 自分たちでアメリカのデータセンターにホストしていますよと。
なのでユーザーが入力したデータっていうのは中国のデータセンターに送られることはありませんよと。
学習されることはありませんよとどうぞご安心くださいというふうに書かれています。 ここがですね国内海外関わらず結構混同している人っていうのが多い印象ですね。
そもそもDeepSeekってオープンソースなんですよね。 なので究極私が自分のマシンにDeepSeekをインストールしてオフラインで使うこともできるわけです。
DeepSeekの技術と利用例
当然オフラインで利用しているので私が入力した情報っていうのは外部に送信されることはないわけですね。
パープレキシティでも同じように自分たちでDeepSeekの利用環境っていうのをアメリカのデータセンターに用意をしていると。
その他の事例で言うと天秤AIでもDeepSeekのR1が使えるようになっています。
この天秤AIっていうのは日本のGMOという会社が展開しているAIモデルの比較ができるサービスですね。
この天秤AIですね最初はDeepSeekのAPIで実装していたんですよ。
入力した内容がAIモデルの学習に利用される可能性があるというパターンですね。
その後ですね、ちょっと批判を浴びたのかどうかわからないんですけど、現在はAzureというマイクロソフト経由のAPIでこのDeepSeek R1を利用する方式に変更しています。
つまりDeepSeek R1、うちは導入していますけども安心して利用できますよというふうに変更しています。
こんな感じでDeepSeekっていうのはテクノロジーとして評価される一方で、
やっぱりセキュリティなどの面で心配の声っていうのはやっぱりあります。
一言で言うとですね結構カオスな状態なんですよね。
もうまさに賛否両論という感じですね。
例えばそうですね一例で言うとDeepSeekに観音小説を出力させるとするじゃないですか。
AIに観音小説を書いてくださいとDeepSeekにお願いをしたとします。
通常であればですねこれはChatGPTとかGeminiとかでも同じなんですけども利用規約で出力できませんとアウトプットされるわけです。
DeepSeekでももちろん利用規約のため出力しませんとできませんというふうにアウトプットされるわけです。
その時にですねDeepSeekがオープンAIの利用規約に抵触するので出力できませんってアウトプットするんですよ。
DeepSeekが。でこれに対してですねDeepSeekがオープンAIのアウトプットを学習させているという疑惑もあります。
つまりChatGPTに生成した内容っていうのがありますよね。でその内容っていうのをDeepSeekの学習に使っているんじゃないかという疑惑があります。
一応疑惑ですね。オープンAI側はそういったことに使われた形跡の証拠があるというふうには主張はしています。
ちなみにこの使い方っていうのはですね、オープンAIが定める利用規約の規約違反に該当します。
オープンAIから出力した内容っていうのを他のAIモデルの学習に使用してはいけませんよと。そうした規約違反をDeepSeekが犯しているのではないかというふうな疑惑ですね。
これですね、さらにカオスというか、あれなのがマイクロソフトがDeepSeekを非難する声明っていうのを出したんですね。
でその非難する声明を出して24時間以内ぐらいでしたかね。 24時間経たないうちにですね、うちでもDeepSeekのモデルの取り扱いを開始しましたっていうふうに発表したんですよ。
もうちょっと何が起きているのかわからないような状態ですね。印象としては純粋にAIモデルの性能ですね、
DeepSeekの創業者とビジョン
競い合う以外にもちょっと色々政治的な、アメリカと中国の政治的な思惑っていうのがなんか色々絡んでいるような印象ですね。
実際アメリカは中国のAIの進歩っていうのをかなり警戒していると思います。 最後にDeepSeekという企業についてもう少し掘り下げたいと思います。
具体的にはDeepSeekの創業者の話も交えて掘り下げたいと思います。 でDeepSeekの創業者、あの当然中国の方なんですけど
えっとですね、梁遠芸さんという方になります。 1985年生まれで40歳ぐらいの方ですかね。
で生まれが中国の関東省で、両親は小学校の先生だったと。 で小さい頃から数学が得意で、その後に数学とコンピューターにのめり込むそうなんですけども
あの後にですね、ハイフライヤーというヘッジファンドを立ち上げます。 でこのヘッジファンドっていうのは簡単に言うと資産を持っている人がいますよね。
でそうした人から資金を募って、で集めた資金を運用していくというファンドになります。 で梁さんは人工知能の技術を使ってこのヘッジファンドを大きく育てていきます。
でそのハイフライヤーのヘッジファンドを運営する中で立ち上げたのがDeepSeekというわけです。 人工知能の技術を使ったヘッジファンドで成功して、でその後にDeepSeekを立ち上げたと。
でこのDeepSeekが特徴的なのが資金調達をしてないんですよね。 ハイフライヤーからの資金調達のみで賄っているという話です。
つまり自前の資金だけで賄っていると。これもすごいですよね。 2023年の5月にDeepSeekを立ち上げて、でその途中でDeepSeek V2とかV3のようなモデルを出してきたと。
で直近だと2025年の1月にDeepSeek R1をリリースしたと。 でこのDeepSeekっていうのはAGIを最終的なミッションに掲げています。
ここでいうAGIっていうのは人間と同様の汎用的な知能を持つ人工知能ですね。 人間と同じような知能を持つAIを開発するのがミッションというわけです。
ちなみに以前DeepSeekのCEOであるりゃんさんがインタビューに答えていまして V2のモデルを作った時、その時のメンバーって全員中国の人材によって作ったと。
インタビューで答えていました。 まあ改めて中国のAI人材の分厚さというか強さを再認識する内容ですね。
でそこからオープンAIに匹敵するAIモデルを作成するまでに至ったというわけです。 でDeepSeek以外でも結構中国初のAIモデルっていうのは躍進しています。
DeepSeekのモデルの性能と利用
例えばアリババっていう会社があるんですけど、アリババが開発するクエンとか あとはキミ1.5とかもありますね最近では。
結構最近では中国勢のAIの勢いというのがすごい印象です。 ちょっと今ですね手元にチャットボットアリーナの最新ランキングがあるんですけど
あの人間のジャッジによってAIモデルのランキングを作るというサービスですね。 でこのチャットボットアリーナのランキングを見てみると
1位がGoogleのGemini 2.0 Flash Thinking で同じ1位にGemini 2.0 Pro Experimental 0205
ちょうど先日リリースされたモデルですね。 でそして3位にChatGPT 4.0
同じく3位にDeepSeek R1 同じく3位にGemini 2.0 Flashですね。 で4位にオープンAIのO1モデルですね。
でこの上位の中でオープンソースのモデルっていうのはあのDeepSeek R1だけですね。 その他はGeminiとかあとはオープンAIの開発したモデルですね。
でちょっとその下に行くとQuenもありますね。中国の企業が開発したものですね。 でその下にDeepSeekのV3
DeepSeekがR1よりも前にリリースしたモデルとなります。 こんな感じでオープンソースでありながらDeepSeek R1というのが検討しています。
はいでは今日のポイントをまとめます。 DeepSeekは中国初のAIモデルとなります。
ラマと同じようにオープンソースで利用可能なモデルです。 2つ目に最新モデルはDeepSeek R1というモデルとなります。
これはオープンAIのO1と同程度の性能と言われています。 ですがコスト面で非常に安くなっているというのがポイントとなります。
そして最後3点目、DeepSeekは誰でも利用できます。 ただしチャットやAPIの入力っていうのは学習される可能性もあるのでご注意ください。
ですがDeepSeekはオープンソースのモデルという側面もあります。 そのため何かAIのサービスを使うとき、例えばパープレキシティとかですね
そういった時にその企業が使っているDeepSeekのモデルっていうのが OSS版かどうかオープンソース版かどうかっていうのも冷静に判断する必要があります。
はい今日はこの辺ということで本日も聞いていただきありがとうございました。 番組ではこのように耳で学べるAIを毎週発信しています。
通勤中や家事の合間にAI情報をキャッチアップできます。 毎週水曜朝に更新していますのでぜひフォローをお願いします。
そしておすすめの生成AIツールをまとめた資料も配布しています。 興味のある方はこちらもぜひ概要欄にリンクを貼っておきます。
お相手は耳で学ぶAIの矢野てっぺいでした。 また次の配信でお会いしましょう。