1. iPad Workers
  2. #150:低コストでも高性能なDe..
2025-02-06 14:19

#150:低コストでも高性能なDeepSeekの誕生秘話

spotify apple_podcasts

👋 こんにちは、はるなです。

今日のテーマは「低コストでChatGPTに匹敵するAIのDeepSeek誕生秘話」です。

🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。リクエスト・感想などは #iPadWorkers のハッシュタグを付けて投稿してください。

🤑 大規模AIモデルの開発には莫大な資金と計算リソースが必要?

最近AI界隈で話題になっている「DeepSeek(ディープシーク)」をご存じですか?

🐳 DeepSeekで読書体験を10倍深める方法

中国のスタートアップ企業が開発したAIモデルで、ChatGPTのような高性能を持ちながら、開発コストを大幅に削減したことで話題になっています。

2025年1月25日に最新モデル「DeepSeek-R1」を正式リリース。このモデルは、数学や推論能力において業界のベンチマークを上回る性能を示しています。

* ChatGPT-4相当の性能を持つ

* 開発コストがわずか9億円(約600万ドル)

* 無料で利用可能(今後も低コスト維持の見込み)

特に注目すべきは、その開発コストです。DeepSeekは、約600万ドル(約9億円)でこのモデルを開発しました。

Metaが開発した大規模言語モデル「Llama 3.1」の開発には数億ドル(数百億円)規模の投資が行われたと報じられています。そんな中、わずか10億円たらずでChatGPT-4並みのモデルが作れたというのは衝撃的なニュースだったのです。

これまで大規模AIモデルの開発には莫大な資金と計算リソースが必要とされてきましたが、DeepSeekはその常識を覆しました。

この低コストAIの誕生の背景には、意外なストーリーがあります。

続きはSubstackで公開中👇

https://ipadworkers.substack.com/p/iwpodcast-150



This is a public episode. If you’d like to discuss this with other subscribers or get access to bonus episodes, visit ipadworkers.substack.com/subscribe

サマリー

DeepSeekは低コストで高性能なAI検索エンジンとして中国で開発され、最近正式にリリースされました。限られた予算とチップで効率的にAIモデルを構築し、注目を集めています。DeepSeekは低コストで高性能な日本語の画像テキスト認識を提供するアプリであり、特に日本語認識に優れているため、ユーザーにとって非常に便利なツールとされています。

00:03
スピーカー 1
iPadのことばかり話す、iPad Onlyなポトチャット、iPad Workersポトチャット。
DeepSeekの誕生
スピーカー 1
今日は、DeepSeekっていうAI系の検索エンジン、AIツール、アプリについての話をします。
スピーカー 2
超低コストでできるチャットGPTとして、最近話題をかっさらっているやつ。
スピーカー 1
そうです。2022年、2023年とかに、オープンAIを倒すみたいな感じで、新規開発というかプロジェクトを立ち上げて、中国で始まった会社というか企業なんだけど、
そこの会社が去年の末ぐらいに、たぶんそのモデルをリリースして、最近なんか正式リリースになったみたいなイメージかな。
スピーカー 2
アプリとかも確か今年に入ってから、2025年になってから出てたっけ?
スピーカー 1
いや、実はもうちょっと前からあったんだけど、話題になったのが、
スピーカー 2
2025のイメージ。
スピーカー 1
1月25日にたぶん正式リリースしてるかな。
スピーカー 2
今が28日だから、最近が結構AI業界その話題をめちゃめちゃ見るねっていう感じになっているのか。
スピーカー 1
元々こういうのが出てきたよみたいな、そのAIツールばっかり紹介しているニュースレターとかを自分が読んでるから、結構前から知ってて使ってたっていうのがあるんだけど、
そのディープシークの誕生秘話みたいなのが結構ストーリーがあって面白くて、
元々2023年に中国の会社で立ち上がったんだけど、
その立ち上げた人っていうのが天才トレーダーで、別のファンドの運営費からそのAIチップを買い占めて、
そのAIチップを使ってオープンAIにかつAIを作るみたいな感じで。
スピーカー 2
金持っとったんや、めちゃめちゃまず。
スピーカー 1
漁師ファンドの運営収益でそのAIチップをたくさん買ったっていうのがまずあって、
ただその頃中国の規制が入って、もうチップ、NVIDIAとかの、
スピーカー 2
買えなくなった状態で。
スピーカー 1
売らないみたいな、もう買えないみたいな。
スピーカー 2
中国への規制だよね、アメリカから。
スピーカー 1
そうそう、売っちゃダメみたいな感じで、中国の中ではいいチップが手に入らなくなって、
もう中国終わったみたいな、中国での開発はもうちょっと難しいって言われてる中、
この人たちは当時NVIDIAで一番優秀というか、
ChatGPTのトレーニングとかにも広く使われてたH100っていうチップがあるんだけど、
そのチップの性能の半分の性能しかないH800っていう別のチップを使って開発に挑んだっていう。
スピーカー 2
予算があると思って制限がかかってしまったからが故に、
その低コストなAI、まあAIじゃない、生成AIが作れてしまったという見方ができる。
スピーカー 1
そう、で、それまでさ、もうフルパワーのめっちゃ優秀なその性能のチップで、
もうガツガツ学習させて開発してたっていうところに、
その性能としては半分しかないやつで、頑張って別のアプローチでやるっていうので開発されたやつなんだけど、
それが結果、その600万ドル、まあ約1億円ぐらいの予算と、
あとそのちょっと280万GPU時間っていう、ちょっと単位よくわからないけど。
スピーカー 2
GPUが280万時間分動いたっていう、なんかそういうことだと思うんやけど。
スピーカー 1
その時間で、チャットGPTの4Oモデルと同じぐらいの。
スピーカー 2
1億でできたの?
スピーカー 1
レベルのモデルを完成させちゃった。
1億円でできたのはやばいね。
DeepSyncの機能
スピーカー 1
ちなみに、その今、メタ社もさ、生成AIっていうかAIのモデル作ってて、
エルラマの405Bって最新モデルがあるんだけど、
それ3000万GPU時間使ってんの、開発に。
だからさっきの、ざっと10分の1、280万GPU時間と3000万時間で、
さらにその、
予算だよね。
予算もだからめちゃくちゃ安くて、開発の時間もめっちゃ短くて、
で、さらに最近そのスコアが出てるんね。
各AIモデルのスコアで、これは得意、これは不得意、
なんか100点満点で点数つけられるスコアがある。
スピーカー 2
CPUのベンチマークみたいなやつが、
AIベンチマークみたいなのが最近現れている。
スピーカー 1
で、それで見ると、
チャットGPT-4とか、クロード3.5とか、エルラマ3.1とかと、
同等、もしくはそれを上回ってるスコアを叩き出した。
スピーカー 2
で、確か電気代4分の1ぐらいなんやったっけ?
スピーカー 1
そう、だから安くて、で、性能はいいっていうので、
それはみんな使うわな、みたいな。
スピーカー 2
なんかあれはね、やっぱあの高発だし、中国とかが得意そうな方向やね、
それで言うと今の。
スピーカー 1
そう、だからそういうのもあって、
現時点では、その個人のユーザーっていうか、
アプリを使ったりとか、ウェブブラウザから使える、
もうそのまま会社名と同じ、なんかDeepSeekっていう、
クジラのアイコンのアプリがあるんだけど、
それ、DeepSyncっていう推論モデルっていうの、
チャットGPTでいう、
スピーカー 2
要領の時間かかるやつ。
スピーカー 1
じっくり時間をかけて、
推論してくれるモードみたいな、
深く考えるモードっていう、
R1モデルも無料で使えます。
で、ウェブ検索機能、
ウェブからの情報を元に、
調べたりとか、リサーチしたりとか、
まとめてくれる機能。
スピーカー 2
チャットGPT、確か有料じゃないとできないやつやったっけ?
スピーカー 1
それも使えます。
さらにその推論モード、
DeepSyncとウェブ検索の重ね技も、
最近できるようになった。
どっちかしか前まではできなかったのが、
今はその推論モードで、
かつウェブ検索も使ってやる、
みたいなことができるようになって、
なんかすごい便利で、
今んとこ無料で使える。
スピーカー 2
向こうの戦略としては、
無料で使えるようにして、
チャットGPTの客をまず持っていこう。
スピーカー 1
そうじゃない?
クロードとか、チャットGPTとか、
いろんな各社、
大体今、日本円で言うと、
月3000円ぐらいの、
有料プランを作って、
それでやってるわけなところに、
このDeepSyncは0円で。
有料化しても、
スピーカー 2
透明は1000円ぐらいでやりそうだよね。
スピーカー 1
元の開発コストが安いから、
そんなにがっつりお金取らなくてもいいから、
今はできるだけユーザー数を増やすフェーズだと思うんで、
そっち、しばらくの間は、
安くで、無料で使えるんじゃないかなって思う。
ずっとこのままかって言うと、
多分どっかでは課金のポイント作ってくると思うんだよね。
そんな感じで、
去年の12月ぐらいから、
自分は使い始めてるんだけど、
最近はアプリ版が出て、
アプリで使えるようになったのとかもあって、
ChatGPTももちろん使ってるんだけど、
それと同じぐらい、
DeepSyncを使ってる。
スピーカー 2
2個あると、あとあれだよね。
落ちた時にもう1個使えるとか。
DeepSeekの特徴
スピーカー 1
交互にやってみたいな感じで、
使ってたりはするかな。
DeepSyncの最初の時点でよかったところは、
画像のテキスト認識がすごく賢くて、
日本語でのテキスト認識がすごく賢い。
スピーカー 2
それは欧米圏じゃない強みかもしれんよね。
漢字文化圏の仲間だから。
スピーカー 1
ChatGPTも画像を添付して、
画像の中のテキストを処理するとか、
読み取って処理を進めてくれる機能ももちろんあってできるんだけど、
今現状、日本語はめっちゃエラーが出る。
スピーカー 2
あんまりそういえば、日本語認識を使ったことないな。
ChatGPTとかで。
スピーカー 1
テキスト認識中にエラーが発生しました。
ある。
進めてくれない作業を。
スピーカー 2
止まるんだよね。
ずっとそれをやり続けて止まるね。
スピーカー 1
っていうのがあって、
あんまりChatGPTで、
画像の中に入っているテキストを抜き出してどうこうとか、
なんかしてくれ、考えてくれみたいなのがうまくできなかったんだけど、
その点、DeepSeekはめちゃくちゃ日本語認識ちゃんとしてくれるので、
一発でも画像からテキストを選んでくれて、
処理をしてくれるっていうすごく便利に使えるようになった。
今まではChatGPTしか使ってないときは、
Appleの標準の機能で画像内のテキスト認識。
あれいいね。
あれでテキストを全部コピーして、
それをベタベタ貼ってたの。今まで。
で、なんでこれ画像そのまま添付でできないのかなって思いながら、
ずっと使ってたんだけど、
それが解消されたので非常に便利だというお話です。
利用方法と懸念点
スピーカー 1
ただですね、iPadに関して言うと、
iPadにDeepSeekのアプリ入れられるんだけど、
まだiPad最適化されてないアプリなので、
画面拡大?
画面拡大というか、iPhoneのたたやの画面が、
iPadの中央にドデンって。
スピーカー 2
画面拡大システムを使うやつ、2倍でウィーンってなるやつじゃん。
スピーカー 1
今もうあんまちょっと違うんだけど、挙動は。
スピーカー 2
iPadは全部のiPhoneアプリを使えますって、
最初の頃に言ってた、あれがまだあるってことだよね。
スピーカー 1
そんな感じなので、Webブラウザから、
SafariからDeepSeekにアクセスして使うほうがいいと思う。
スピーカー 2
キーボード使えんしね、その向きだと。
使えなくないけど、横向いてやらんといけないってことでしょ。
スピーカー 1
横画面でもその真ん中にドデンって縦に出る。
スピーカー 2
どっちにしても絶望的やんな。
スピーカー 1
せっかく広い画面があるのに、
入力エリアとかちっちゃい状態でしか使えないから、
スマホで使うならアプリ版のほうが便利だし、
iPadで今、現在使うんであれば、
Webからアクセスするがおすすめ。
その辺Webからも同じ履歴。
一応ログインが必要なんだけど、
Googleのアカウントとかでもログインできたかな、確か。
ログインしてればアプリからでもWebからでも
同じ続きができるっていうの。
その引き継いでくれるから、
その辺りも別に問題なく使えてるかなって感じ。
スピーカー 2
なんか懸念点とかは特にない?
スピーカー 1
懸念点は中国のアプリなので、
データを何に使われるかとかちょっとわかんないから。
スピーカー 2
Sambaは中国にあるってことだよね、多分。
スピーカー 1
細かくは出てないんだけど、
画像のアップロードとか画像の認識とかも
ローカルでやっているわけでは全然ないので、
スピーカー 2
会社のプライバシーがどこまでしっかりしているか。
スピーカー 1
企業の情報とかをガンガンやってっていうのは、
ちゃんと調べてからのほうがいいと思うし、
そういう使い方をするなら、
ちゃんとAPIでの利用みたいなののほうが
多分安全だとは思う。
その辺はちゃんと利用規約を読みましょうとか。
スピーカー 2
読めんのやけどね、現実的に規約全部は。
利用規約をちゃんとGPTに聞けばいいのか。
スピーカー 1
このページのこれでこういうことしたいんだけど
みたいな話しかければいいと。
スピーカー 2
規約を読んで要点とか内容を確認するとかは
特に得意なところだよね。
GPTとかその手の生成AIの。
スピーカー 1
そう、AIツールの一番得意なところなので。
スピーカー 2
ちゃんとGPTに新しいほうのやつを聞いて
お互いの規約を読ませてみればいいんだね。
スピーカー 1
そう、なんかね、あれね、自社のことになるとね
ちょっとね、濁してくる。
スピーカー 2
絶対やると思う、そういうの。
スピーカー 1
それは何たらかんたらで、みたいな。
多分そこに関しては結構細かく
その答えられることと答えられないことみたいなのを
多分やってるんだと思うんだけど
自分とこの機能とかなんかそれについては
あんまちゃんと答えてくれない。
スピーカー 2
だからお互いに相手の会社の規約を読ませて
比べてみましょうよね。
スピーカー 1
まあそんな感じで
DeepSeekっていうクジラさんのマークのアプリとか
Webから使えるツール
最近はよく使ってるよっていうお話でした。
番組への感想やリクエストなどは
シャープ、iPadワーカーズのハッシュタグをつけて
投稿してください。
それではまた来週。
iPadワーカーズポトキャスでした。
14:19

コメント

スクロール