1. リブラの 精神科のバックヤード
  2. DeepSeekとo1 pro、どっちが賢..
2025-01-29 05:23

DeepSeekとo1 pro、どっちが賢いのか検証!

📻🦨スカンクとリブラの精神のPライン🐘
https://stand.fm/channels/6161e521afa93b18fcd77817

ヒーロースカンクさんのスタエフ
https://stand.fm/channels/664b1a48316143a771f4d710

リブラ X(Twitter)
https://x.com/okawari

#健康 #子育て
---
stand.fmでは、この放送にいいね・コメント・レター送信ができます。
https://stand.fm/channels/6349996e0cee2a08caf592dd
00:06
おはようございます。バスエノスの 精神科リブラです。
今日はショートで行きましょう。短めに行きますよ。
今からすぐ仕事ですからね。
DeepSeekショックっていうのが今あるでしょ。
AIのDeepSeekっていうのがすごいっていう中国のね。
ということで、DeepSeekがどのくらいすごいかを
僕、ChatGPT o1 proも契約してますんでね。
比べてみようと思ってね。
何年か前にロンリークイズ好きの
お皿なじみの友達がいましてね。その人から送ってきてね。
昔だって僕がやった記憶の中で結構難しかった。
すごく時間かかって、すっごく時間かかって正解にたどり着いたという問題があったんでね。
それをやってもらっているんですよ。実はね。
簡単に言いますよ。パパッと言いますよ。
今、ネットで検索してその問題検索したんだけど。
聞いても多分わからないしね。
かなり時間かけないとわからない。すっごく難しい。
あるパーティーに3人の幼女ABCが招待された。
以下は幼女たちの発言である。
パーティー2日前。A、Bはパーティーに行くよ。
B、Cはパーティーに行かないよ。
C、私が出席する場合だけAもパーティーに行くよ。
パーティー1日前。幼女A、私が欠席する時だけCは出席するよ。
B、私たち3人の中でパーティーに行くのは偶数人だよ。
C、Aはパーティーに行くよ。
パーティー当日。A、まだ2018年にはなってないよ。
B、私が行く時だけAも行くよ。
C、3人のうち少なくとも1人はパーティーに行かないよ。
この3人の幼女については以下の事実が判明している。
1人だけ絶対に嘘をつかない幼女がいる。
別の1人は今日が2で割り切れる日なら嘘をつく。
それ以外の日なら真実を言う。
残る1人は今日が3で割り切れる日なら嘘をつく。
それ以外の日なら真実を言う。
さあ問題。パーティーに出席する幼女は誰か。
2、パーティーの日程が将来だとすると、
開催は西暦何年の何月何日だろうか。
ちなみに問題文が発表されたのは2015年8月18日である。
これをどちらが正解できるか、両方正解できるかと思ってやってみたんですけど、
両方答えがまちまち。
ネットに書いてあった答えとは両方とも違うんだよね。
僕ね、昔自分でやって納得した答えがあるんだけど、
これね、自分の答えがさ、ネットの答えが合ってるのかわからないでしょ。
自分で検証しないといけないかなと思うんですけど、
自分がね、やった答え、これたどり着くのむちゃくちゃ大変で、
もう1回、もう1回頭使わないといけないんで、
03:00
これやったの10年くらい前なんで、10年分頭を取られてるんで、
パッとわからないですよねこれ。
で、たぶん、せっかくやりたい人がいるかもしれないから、
ちょっと答え言うとあれなんで、ヒント言いたくないんで言わないですけど、
ある種のことに気がつくと、答えは割と出るんだけど、
場合分けして考えていって、ずいぶん悩まされたんですけど、
だいぶ経って、あ、と気づくことがあって、
あ、そういうことかって気づいたら、意外とポンポンとこう、
てことはここか、ここの日だな、てことはこうかみたいにして、
逆にこう考えて、答えわかるんですけど、
もう1回ちょっと考えないといけないんで、すぐ答えが出なくて、
で、やってみたところ、ディープシークもチャットGPTもね、
全然正解にたどり着かないですね。
ディープシークの方が一番正解に近いところまで行ってた感じがするんで、
こっちの方が賢いのかなと思うけど、今何回か検証するんだけど、
これ1回検証することに数分かかるんですよ。
答えが出るまでに2分かかるんで両方とも、
GPTのO1 Proも、ディープシークの、
ディープシークモードも、ディープシンクモードもね、
なのですっげー時間かかってて、答えは自分でもう1回やらないとわからないので、
結局、答え言いますよ。
ディープシークもチャットGPTもそんなに賢くなかった正解はこれでした。
少なくとも10年前の僕より賢くなかったね、これはね。
今の僕とはどうでしょうかというところですけど、
まあでもね、時間の問題でもっと賢くなるんでしょうけど、
まあそこまで大したことないなと思いながら今、
ちょっと問題の条件の立て方が悪かったかなと思って今、
ディープシークの考えの思考の途中を見ていたらね、
ちょっと間違えてるところがあったんで、読み違いのところがあったんで、
日本語の読み違いがあるんだと思って、
こちらの条件提示が良くなかった。
2で割り切れる日というのがね、年月を含んだり含まなかったりみたいなことで、
なんかちょっとディープシークが誤解をしてたので、
2で割り切れるというのは年月は関係なく、
1桁の1日だけが年で割り切れれば年で割り切れる日だよっていうようなことで、
条件を追加してもう1回GPT ProとProモードと、
ディープシークのディープシークモードで今ちょっとね、
再度検証しておりますので、またね、
分かりましたらまた答えを言おうかなと思いますけど、
ということでね、結論出ませんでした。
そんな賢くなかった。
じゃあ仕事に行ってこよう。
それでは皆さん、さようなら。
05:23

コメント

スクロール