1. Podcast by Yuka Studio // ユカスタポッドキャスト
  2. Ep.106 AppleがAIの限界を暴い..
2025-06-14 55:37

Ep.106 AppleがAIの限界を暴いた?! 👀 今週のテックニュース

spotify apple_podcasts youtube

Apple WWDC 2025 関連動画

https://youtu.be/5QJ7rL4EFys?si=rfJ9DkdwexsTYaK-

https://youtu.be/Ga97NlHWxyo?si=5eg9nOaKNEuxb2qF


WWDC25: macOS Tahoe は Intel Mac の最後のサポート

macOS Tahoe(バージョン26)は、2025年6月9日のWWDC25で発表された最新macOSで、Appleシリコン搭載Macと一部のIntel Mac(T2セキュリティチップ付き)に対応する最終バージョンになります。


Apple Home、iOS 26とiPadOS 26でEnergyKit導入

AppleはWWDCでは触れなかったものの、新たにEnergyKitというフレームワークを導入し、Homeアプリを通じて電力消費の最適化が可能になります。電気料金やクリーンエネルギーの可用性に応じて、スマートサーモスタットやEV充電などを自動制御できます。


アップグレードされたSiri、iOS 26.4で2026年春に登場予定

Appleは、WWDC 2024で発表したSiriの高機能化(個人設定の理解、画面操作への対応など)を、当初の2025年後半から遅らせ、iOS 26.4として2026年春のリリースを計画しています。


Appleの研究がAIモデルの“根源的限界”を暴く

Appleの研究チームは、高度な推論を行う大規模AI(LRM)は複雑な課題で「完全な精度崩壊」に陥り、アルゴリズム提供下でも推論力が低下するという重大な限界を明らかにしました。


Meta、物理世界を理解するAI『V‑JEPA 2』を発表

Metaは新しいワールドモデル「V‑JEPA 2」を発表。動画ベースで物体の動きや因果関係を学習するAIで、ロボティクスや自動運転など物理環境での応用を大きく前進させる可能性があります。


Scale AI、新CEOにDroege昇格、創業者WangはMetaへ合流

Scale AIは、CEOで創業者のAlexandr Wang(28歳)がMetaへ移籍するのに伴い、現戦略責任者であるJason Droegeを後任CEOに昇格させる計画を発表しました。同時に、Metaが約150億ドルでScale AIの49%を取得する大型投資も進行中です。

この動きは、MetaによるAI分野への本気度とScale AIのデータ生成・戦略的人材の重要性を示すものです。Wangが戦略ラボに加入することで、MetaのAI競争力強化が本格化します。一方、Scale AIはWang後の体制への移行期に入りますが、データビジネスは従来通り継続される見通しです。


ウェブを席巻する“リアルタイム取得”AIボットの衝撃

TollBitの最新レポートによると、AIモデルが必要な情報をリアルタイムでウェブから取得する新型ボットが急増し、これにより従来の検索エンジン中心のウェブ構造が大きく変化しつつあります。特にAIによる要約や参照の需要が高まり、ニュース媒体への閲覧者トラフィックが減少する一方、取得ボットのアクセスは劇的に伸びています。


ChatGPTが火曜日にダウン?何が起きていたのか

ChatGPTと関連サービス(APIやSoraなど)は、2025年6月10日(火)の午前中に世界的な大規模障害に見舞われ、10時間以上にわたって部分的または完全に利用不可となりました。


Snapの次世代ARグラス“Specs”がMetaのRay‑Ban Metaを超える理由

Snapは開発者向けに提供しているSpectacles最新モデルから、2026年に一般向けへと進化する新ARグラス「Specs」を発表。軽量化とAI統合で、MetaのRay‑Ban Metaを大きくリードします。


Koons × Lexon:バルーンドッグがスピーカーとランプに変身

Jeff Koonsの代表作「Balloon Dog」が、Lexon DesignとThe Broad美術館とのコラボで、機能的なアート作品へと進化。11インチサイズのスピーカーとランプが、それぞれBluetoothサウンドとLED照明を搭載し、アート性と実用性を兼ね備えています。

Jeff Koonsの象徴的な「Balloon Dog」が、実用的なインテリアアイテムとして再発明。美術とテクノロジーの境界を揺るがす一品で、愛好家やデザイン志向の人々から熱い注目を集めそうです。


Labubu配布禁止


= = = = = = = = = = = = = = = = = = = = = = = = =

【ユカスタポッドキャスト // Podcast by Yuka Studio】

ユカスタポッドキャストは、テックとクリエイティビティがもっと身近になる、トーク番組です。

ニューヨークを拠点に、テック系クリエイターとして活動する大石結花がメインホストとして、テックニュースや、インタビューコンテンツをお届けします。

🌟⁠⁠⁠⁠Youtube⁠⁠⁠⁠: 日本語YouTubeチャンネル

🌟⁠⁠⁠⁠Youtube⁠⁠⁠⁠: 英語YouTubeチャンネル

🌟⁠⁠⁠⁠Community by Yuka Studio (ユカスタコミュニティ): メンバーシップに加入すると、特別なバッジ・絵文字が使えるようになり、メンバー限定のDiscordチャットや、もくもくLIVEに参加できます。

🌟⁠⁠⁠⁠ニュースレター: 月に一度ほど、Yukaのコラムやアップデートがメールで届きます。

🌟⁠⁠⁠⁠ Instagram⁠⁠⁠⁠: Podcastや動画、そのほかのby Yuka Studio 関連の最新情報をお届けします。

サマリー

今週のエピソードでは、ユカさんとサヒロさんがWWDCのニュースやスタンドアップコメディの経験について話します。また、椅子とキーボードの買い替えについても言及し、UFC選手アマンダ・ヌネスの復帰に興奮する様子も紹介されます。Appleの研究チームは、大規模AIモデルLRMの限界に関する調査結果を発表しました。この研究は、複雑な問題に対する推論能力の低下や完全な制度崩壊を明らかにし、AIモデルの性能に対する新たな視点を提供します。Appleの研究によって、AIモデルの限界が示され、AGI(汎用人工知能)到達の難しさが浮き彫りになります。さらに、メタが新しいAIモデルを発表し、ロボティクス分野への応用が期待される中、スケールAIの経営陣に変動があったことも伝えられます。AppleはAIの限界やニュースメディアの変化について語ります。特に、チャットGPTの障害やSnapの新ARグラスに焦点を当て、技術の進化とビジネスモデルの変化がもたらす影響について考察します。エピソードでは、AppleのAI技術の限界について議論され、最新のテックニュースが紹介されます。特に、セレブとのコラボレーションや新たなファッションアイテムの発売が注目されます。

WWDCのニュース
ユカスタポッドキャストへようこそ。 ユカスタポッドキャストは、テックとクリエイティビティがもっと身近になるトーク番組です。
今週のエピソードは、ユカとさひろが、今週気になったテックニュースについて、いろいろとおしゃべりします。
ユカでーす。今週は、WWDCでしたね。
お疲れさまでした。
なんか、お祭り騒ぎみたいな感じだから、2日間ぐらいが、1週間分ぐらいの交差で。
確かに。
月曜日の朝、朝というか昼か、こっちだと。
そうですね。
月か、わーっとやって、水曜日ポカーンとして、っていう感じだったんですけど。
実は水曜日に、初めてかな、スタンドアップコメディをニューヨークで見に行ってきて。
はい、いいですね。
最近結構私のアルゴリズムでは、スタンドアップコメディのショート動画みたいなのがめっちゃ出てきて、結構見てたんですよ。
いろんなタイプの人がいるじゃないですか。
普通にずっと自分でしゃべる人もいれば、すごい客いじりがゲームみたいな。
とにかく客をずっといじりまくるみたいな。
とかありますけど、私が行ったのは、日本人なのか日系アメリカ人の人のフミ・アベさんっていうコメディアンの方と、その愉快な仲間たちみたいな感じで、
フミさんが最後にちょっと長めのスポットがあって、前に3,4人?3人かな?別のお友達のコメディアンがちょっと短めのセットをやるみたいな。
盛りだくさん。
すごいバーの地下が会場で、結構ぎゅうぎゅうだったんだけど、何人くらいいたのかな?60人くらいのキャパかな。
最後の方も立ち見とか出てたんですけど、私たちちょっと絶妙な時間に行ってしまって、一番前の席になっちゃって。
一番前の席に座るか後ろで立つかみたいな。
空いてたんですね、一番前は。
一番前はもうみんないじられたくないから空いてて。
で、ぽんぽんぽんみたいな、3人で友達に行ったんで、3人まとめて座れるのがもう最前列しかなくて、うわーって思いながら座って、
なんかちょっと話しかけられたり、ちょっとウェーとか言って絡まれたりしました。
いやいいですね、最前列楽しい。
なんかいつもリールスとかテックトックみたいなショート動画でスタンドアップを見てるとめっちゃ気楽じゃないですか。
だから最前列で見るともういついじられるかわかんないから、もうずっと緊張してるみたいな。
でも楽しかったです。
ふみあべさんですね、チェックしてます。
ぜひ、今日彼が上げてたストーリーズで、ちょっとスクショ入れときますけど、私の後頭部がめちゃめちゃ映ってる。
最前列すぎて。
すごい、それはちょっとぜひとも、ゆかさんの後頭部をチェックしなきゃ。
入れておきます。
私あんまり日本のお笑いはちょっと鬱陶いんですけど、
アメリカのスタンドアップとかは好きですね。
なんか気楽に見れて、なんかすごいいろいろストリームされてるじゃないですか。
エンドレスに見続けられる。
確かにいろんなレベル感というか、なんかネットフリックススペシャルとかもあるじゃないですか。
1時間半とか2時間ぐらいずっと一人で喋り続けるみたいな。
あれは本当にもう最高峰の人たちだけど、
多分そういうニューヨークのバーでやってるとか、コメディークラブでやってるとか、いろんな人がいるからめっちゃ面白いんですけど。
でもなんかハズレもすごいあるらしくて。
ハズレに当たると悲惨というのも聞きました。
ハズレに当たってしかも最前列に座っちゃってたら本当につらいしかないですね。
それは最悪すぎる。絶対帰ろうとしたらそれもイジられるやんみたいな。
帰るんかーいって言われる。
私も来週かな、MOさん見に行ってきます。
MOさんはパリスチナ人のドラマになってたMOさん。
ヒューストンの移民のMOさんですね。
彼がダラスに行きますので。
彼もネットフリックスがあるの?
彼はドラマの前かなんかにネットフリックススペシャルをやってて、前かとかちょっと微妙なんですけど、
そのドラマの内容をスタンドアップでコミカルに話すみたいな内容で、それも良かったですね。
それは席決まってる系ですか?
私はすごい後ろの方です。結構いい会場です。
もう本当に天にしか見えないぐらいだから、結構だから売れてるんだなって思った。
そうか。楽しんできてください。
さひろです。今週はいろいろありましたね。
新しい椅子とキーボードをよかったメンバーの皆さんに色々アドバイスをいただきながら買いましてですね。
今、この座ってる椅子はまだデイワンですね。
昨日持って帰ってきて、初日でございます。
どこの高さがいいのかよく分かってないみたいな感じ。
どうですか?今のところ。
今のところなんかあのスティールケースのアミアっていうやつを買ったんですけど、
なんか今まで私が座ってた椅子って、
座席っていうのかな、お尻を乗せるところが広くて、
なんかこう深く座れなかったんですよね。
深く座れないと、なんかこうちょっとお尻が宙に浮いたような状態で仕事するみたいな。
どういうこと?
宙に浮くっていうか。
空気椅子?
なんて言ったらいいのかな。
背もたれまでお尻と背中がくっつかないみたいな。
分かります。
でもそうするとちょっと前傾姿勢になっちゃうからあまり良くないみたいな。
まさにそれだと思って。
今回このアミアはね、あの椅子をこう前後にも移動できるし、
このアームレストもなんか4Dみたいな感じでめっちゃ移動できる。
4D?四次元?
四次元。
時空も超えてくるみたいな。
とにかくすごいアジャスタイルで、
今のところめっちゃいい感じでございます。
じゃあ今その、どこが一番いいのかみたいな。
アジャストできるのはいいけど、できすぎてしまって。
正解がわからないみたいな。
そうなんですよ。
で、うちは机がね、固定されてて上下には動かないので、
ここが固定されてるから後は椅子をね、決めるだけなんですけど。
そうなんですよね。
確かに変数があまりにも多すぎる。
一生かかってもわからんみたいな感じです。
キーボードはこれね。
ロジテック、ロジクール。
ロジテックのWAVEっていうやつですね。
ちょっとやっぱあれですか、開く感じします?
多分。
ちょっとこれをまだ使って3日目ぐらいだから。
3日目?
3日目。
多分。
ちょっとこれをまだ使って3日目ぐらいだから。
ちょっとあれなんですけど。
タイピングが遅くなりますよね、キーボード変えると。
しかも結構配列というか、角度が変わると。
なんかウニョウニョしてて、違うとこしちゃったみたいな。
ミスタイプが。
そうなんですよ。
ちょっとそれも慣れないといけないなという感じで。
椅子とキーボードの新調
はい、頑張っていこうと思いますけど。
いいですね、でも新規いってんな感じで。
あと1個だけいいですか?
なんですか?
私今このTシャツを着てるんですけど、
すごい小惑星が着るみたいなTシャツを着てるんですけど、
これUFCの女性のファイターで、
アマンダヌネスさんっていう人がいるんですけど、
この人がね、なんと帰ってきます。
ちょっと待って、どっか行ってたの知らないんだけど。
UFC見てる人がいるかちょっとわかんないんだけど。
2年くらい前にリタイアしまして、
ブラジルのザ・ライオネスという、
あだ名っていうか、
思ったヌネスさんがですね、
こういう方のチャンピオンで、
奥さんが多分出産したかなんかで、
子供が生まれてちょっと休みもあってて、
この前ね、土曜日にUFC見てたんですけど、
帰ってきますっていう宣言を。
えー、復活?
復活でございます。
私の推しはいなくなるっていう、
ジックスが。
打ち破られた。
イエーイ。
よかったですね。
はい、よかった。
ということで、
それをちょっとみんなに伝えたかった。
おめでとうございます。
ありがとうございます。
UFCファンの皆さん、
一緒に応援しましょう。
そういえば前話してたニックスはもう終わりましたね。
ニックスね、負けちゃいましたね。
いやーでもまさかちょっとね、
インディアナペイサーズがね、
すごい意外にちょっと今2勝1敗で勝ってて、
あれっていう感じ。
しょぼいのにって。
いやーなんかそこまで、
期待されてない?
うん、期待してなかったんだけど、
なんかこう試合を重ねるにつれて、
あれなんか実はすごい良いチームなんじゃないかっていう感じになってきてますね。
でもどうもね、ちょっとね、
なんかちょっと好きになれないんだよな。
そうなんだ。
私はちょっとインディアナ、
ケンタッキー、インディアナ、オハイオーはちょっとあの、
日本で言う東海地方みたいな。
東海3県みたいなイメージで、
ちょっとシンパシーがある。
おー。
じゃあユカさん、
インディアナですかね。
オクラホマはね。
知らん。
知らんけど。
それかオクラホマ?
オクラホマサンダーですね。
オクラホマサンダーは若い選手が多くて、
見てて楽しいんですよ。
MVPを取ったシェイ選手っていう人がいるんですけど、
その方はカナダ人でですね、
なんかそれもまた良くて、
でなんか結構いろんなインタビューを受けてるんですけど、
コメントもまたかっこいいみたいな感じで、
大好きです。
推しだ。
あ、って言うと負けちゃうから。
やめよう、言うの。
そうなんですね。
MBAチャンピオンシップはいつ決まるんですか?
でも今2勝1敗で4勝した方が勝ちだから、
あと2戦で決まるかもしれないし、
かもしれないし、
7戦目まで行くかもしれないので。
最大、最大2戦目まで。
最大、最大2週くらいですね。
最大4週。
6月半ば、末ぐらいかな。
一番長くて。
はい。
じゃあまた、いろいろ教えてください。
はーい。
今週はね、結構あの、
ニュースがいろいろありまして、
ダブダブウィークだったんですけれども、
Apple以外も、
結構なんかいろいろありましたので、
早速行ってみましょう。
まずちょっと、
WWDCのまとめに関しては、
スタンドアップコメディの経験
もう私のチャンネルで、
全体のまとめの動画と、
iPadOSに特化した、
なんか解説動画みたいなのが出ているので、
まだそちらをチェックされてない方は、
ぜひそちらをチェックしていただいて、
ちょっと今回、
床サポートキャストでピックアップしたのは、
もうちょっと細かい話とか、
そのキーノートにはなかった話を
いろいろしていきたいので、
よろしくお願いします。
はい、まず一つ目。
WWDC25 Mac OS Tahoは、
Intel Macの最後のサポート。
Mac OS Taho Ver.26は、
2025年6月9日のWWDC25で発表された最新Mac OSで、
Apple Silicon搭載Macと、
一部のIntel Mac、
T2セキュリティチップ付きに対応する
最終バージョンになります。
とのことで、
さひろさんも今、Intel?
私が今使っているのは、
M1 Maxなんですけど、
その前に買ったiMacで、
今夫が使っているのが、
Intelです。
最後の。
T2セキュリティチップ付き?
それはどこで分かるんだろう。
iMacどのバージョンとか分かります?
買ったのは、
2021年とか?
20年モデルがありますね。
ああ、それかもしれない。
もしかしたら。
そうですね。
Retina 5K、
27日、2020年。
私のiMac Proはもう駄目か。
もう駄目で、
Mac Pro、2019年のやつ。
おお。
これも最後です。
ああ、そうなんだ。
これ、
みんなもう買い替えなきゃいけないってこと?
この次のMac OSが出るタイミングで。
来年ってことですかね?
うん、来年。
来年か。
1年半後ぐらいに。
買い替えなきゃいけないわけじゃないかもしれないけど、
別に古いOSで使っても。
一人だけ過去を生きている。
いいけど、最新の機能とか使いたかったら、
買い替えなきゃいけないかもしれないですね。
エナジーキットの導入
次。
Apple Home iOS26とiPadOS26でエナジーキット導入。
AppleはWWDCでは触れなかったものの、
新たにエナジーキットというフレームワークを導入し、
ホームアプリを通じて電力消費の最適化が可能になります。
電気料金やクリーンエネルギーの可用性に応じて、
スマートサーモスタッドやEV充電などを自動制御できます。
これはiOS、iPadOSとかのホームアプリから、
クリーンエネルギーが供給されているときに
EV充電をたくさんやってくださいとか、
冷房かけていいよとか、
そういうのを自動化するみたいなフレームワークだそうです。
対応しているのは、
エコビーとかGoogleネストとかみたいなサーモスタッドとか、
EV充電器とかがあるんですけど、
今後また対応機器とも連携できる予知があるのではないかということです。
ということで、
一応Googleネストのサーモスタッドがあるので、
じゃあ使えますね。
使えるといいな。
ちょっと古いモデルなんだけど、
それ買い替えればいいのかな?
もし対応しなかったら。
家に付いてたから、
設定とか全くしてないので、
どういうふうに設定するのかよくわかってないんですけど。
買い替え付け替えるのは簡単そう。
ですよね。前Googleで見ましたもんね。
あれ綺麗でしたよね。
これから冷房がいっぱい必要な季節になってくるので、
クリーンエネルギーを使うっていうのもいいし、
それを通じて電気料金も抑えられたら、
ウィンウィンというか、
みんなハッピーって感じなので、
いいアップデートだと思いました。
では次。アップグレードされたSiri。
iOS26.4で2026年春に登場予定。
AppleはWWDC2024で発表したSiriの高機能化、
個人設定の理解、画面操作への対応などを
当初の2025年後半から遅らせ、
iOS26.4として2026年春のリリースを計画しています。
結構なんとか10.4とかで大型アップデートがあることが
よくある気がするんですけれども。
大体26.0が9月に出て、26.1、26.2っていって、
26.4になる頃にはもう春になっているという予測。
キーノートの中でもクレイグさんがちょっと
間に合いませんでしたっていうか、
完成度がAppleの基準に達しなかったので、
ちょっとまだ出せませんと言ってましたね。
そして今回なんかあんまりSiriについての言及が、
もうそこ以外なかったですよね逆に言うと。
確かに1回しかSiriって言わなかったっていう話だったと思います。
多分去年とかはもうめっちゃいっぱい言ったと思うんですけれども、
あんまり出てきませんでした。
まあでもどうですかね。
ちょっとそのこの機能が使いたいから、
去年iPhone16とかを買ったみたいな人がいれば、
なんか話が違うじゃないかってなるかもしれない。
そうですね。
そうか。
具体的にどういう機能だったかというと、
Siriを通じてiPhoneの中にあるいろんな個人情報というか、
私だけに関する情報、
例えばテキストの内容だったりとか、
いろんなアプリの情報とかをオンデバイスで持っていて、
それに対して画面操作までやってくれるっていうことだったので、
例ではお母さんが今フライト中なんだけど、
何時に到着するかっていうと、
何時に到着するんだっけみたいな感じでSiriで聞いたら、
何時何分に到着予定ですみたいな感じで教えてくれて、
それに間に合うようにUber呼んどいてみたいな感じですよね。
そうでした。
テキストの内容を聞くだけじゃなくて、
そこで得た情報に対して別のアクションをアプリで行えるみたいな、
結構便利そうな機能だったんですけれども、
もうちょっと待たなきゃいけないという感じですね。
結構独占インタビューみたいなやつがいろいろあったんですけど、
割と責められているというか、
WSJのジョワンナさんとかのインタビューでも、
クレイグさん顔が若干引きつって、
かわいそう詰められて、
ちょっと詰められてたみたいな感じで、
ここに関しては若干残念ではあったんですけど、
他のApple Intelligenceの機能が結構いいと思ったので、私は。
ショートカットアプリの中で、
Apple IntelligenceだけじゃなくてChat GPTを使えるとか、
それMacのセクションで発表されてたけど、
実はiPhoneでもiPadでも使えるので、
すごいいろんな可能性が増えるんじゃないかなっていうのと、
MacのSpotlightだとちょっと同じようなことできそうですよね。
確かに。
何々さんにメールを送ってみたいな感じで言うと、
メールを起動しなくても、
その内容のメールが送られるとかっていうのがあったので、
近いことができてはいるかなという感じなので、
春まで期待して待っていたいと思います。
AIモデルの限界に関する研究
では次。
Appleの研究がAIモデルの根源的限界を暴く。
Appleの研究チームは高度な推論を行う大規模AI、LRMは
複雑な課題で完全な制度崩壊に陥り、
アルゴリズム低強化でも推論力が低下するという重大な限界を明らかにしました。
これ300ページくらいあるのかな?論文が出ていて、
要するに大規模推論モデル、LRMというのが、
LLMは大規模言語モデルでしたけど、
推論モデルというリーズニングがあるんですけど、
もっとすごいという感じがあるじゃないですか。
私、ベンチマーク的にもすごい複雑な問題を解けるとか、
こんなにパフォーマンスアップしてますみたいなベンチマークが各社から出てたりしていたんですけど、
Appleが他の会社のAIモデルをいろいろと持ってきて全部テストしたところ、
結構限界があるということに気付いたという研究内容です。
それが何かというと、最先端のLRM、例えばO3 mini、これはChatGPTのものとか、
DeepSeq R1、Cloud 3.7、Sonnet、Syncingとか、
そういうモデルを使っていろんな複雑さのレベルの問題を与えて、
それをどうやって実際に推論しているのかというのをテストしたという内容になるんですけど、
このAIのテストが難しいのって、そもそも本当にそれを解いているのか、
答えを暗記しているのかわからないし、結構答え暗記しちゃっている場合がすごい多いんじゃないかというので、
推論している過程が見えないと、めっちゃ難しい問題を出しているのにパッて答えが出るから、
できてる、できてるってなるけど、ただそれを学習してあるから答えがすぐ出てくるだけで、
本当に厳密にそれを解いているわけじゃないのではないかというところがあります。
何をやったかというと、Hanoiの塔という、これはゲームというかパズルがあるんですけど、
3つの塔というか杭みたいなのがあって、そこにいろんな大きさの輪投げの輪みたいなのがあると考えてください。
例えば大中小みたいな、それが大中小だけだと3だけど、これがいろんなレベルの大きさがあるかもしれなくて、
例えば5個の大きさの場合もあるかもしれないし、7個とか、
どんどんこの数が増えていけばいくほど難しくなってくるんですけど、
このN枚の円盤を一番左の杭にまず全部入れておきます。
一番下が一番大きくて一番上が一番小さい輪なんですけど、
それを一つずつ別の杭のところにこうやって動かしていって、
最終的に一番右の杭に全部同じくらいの大きさの輪投げを入れていきます。
一番右の杭に全部同じように大から小まで並べなきゃいけないんですけど、
その過程で小さいやつの上に大きいやつが乗っちゃいけないというルールがあって、
いろいろ戻したりやったりとかして、動かしたり戻したりして最終的にその一番右に動かすというパズルです。
その枚数が増えるほど結構指数関数的に解くのに必要な移動数が増えていくんですね。
その最終移動数は2のn乗を引く1らしいから、
AIモデルの限界
5枚だったらnの5乗だけど何乗のところが増えていくからどんどんどんどんびよーんと増えていくという感じなんですけど、
なので結構難しさを調整できるというか、そういうパズルだそうです。
これに関して解き方のコードみたいなのがあるらしいんですよ。
そういうふうに計算したら最適な動かし方が出るようみたいなアルゴリズムを組むことができるんだけど、
そもそもこの実験ではまず最初からゼロから何も与えずにこれを解いてくださいってモデルに行ったときに考えて考えて考えてってやるんですけど、
ある一定のところに行くと100点ぐらいに行くともう無理ってなって諦めちゃうっていうことが起こっていると。
それもAIが考えるときにトークンを使うじゃないですか。パワーみたいな。ちょっと簡単な説明がわかんないけど、
とにかくまだまだそのAIのモデル的には馬力が残っているはずなのに途中でもう無理ってなったらそのトークンを使わずにやめちゃうみたいなことが起こっているということに気づいたらしいです。
なんかすごい簡単なタスクだとLRMでもLLMでもLLMは単純なタスクだったらできる。で、LRMは上回るパフォーマンスでできたみたいな。いいねっていう感じだったんですけど、
中くらいの難しさだとやっぱりLRMの方がシンキングモデルだから思考がある程度あってちょっと優位性があると。LLMにはできなかったことがLRMができるようになるっていうことがあったんだけど、
さらに難しい問題になるとLRMと普通のLLM両方でパフォーマンス崩壊して精度がゼロになると。この崩壊を遅らせることはできるんだけど最終的にはどうしても限界に達してしまうと。
直感的に考えると難しくなればなるほどトークンをいっぱい使って頑張って考えそうなんだけど、もう何かその一定を突破しちゃったらトークン数を減らしてもう諦めちゃうんですよね。簡単に言うと。
だからこれはLRMの推論能力の根本的な限界を示しているのではないかというのが結論。
これを回避する策はないっていうことなのかな?
そう今のところ回避できなくて最近みんながAGIとか言ってるじゃないですか。
汎用人口知能だそうです。
基本的に私はもう人間の知能を超えて。
そうですねそういうイメージだった。
何かを突破してますよね。
突破している。
それがもうすぐ来るっていうのをみんながいろいろ言ったりしてそれに対してちょっとこうディストピア的な未来を想像したりなんか悲観的になったりしている人もいるけれども
この研究結果によると多分大丈夫じゃねえみたいな。
大丈夫じゃねえじゃないけどAGIに到達する今のこのモデルではもう到達できないという見解を示しているそうです。
安心していいのか残念だったね。ちょっと複雑ですが。
なんかやっぱりそのベンチマークが難しいというか各社が違うテストをしているかもしれないしみんな毎年出たらこんなに何パーセント良くなりましたとか言ってグラフが出てくるけど
それが意味していることが結構わかりにくかったりとか数学とかコーディングの問題を与えてモデルをテストするかもしれないけど
その最初に言ってたように答えをもう知っちゃってる状態でテストしてもそれって本当の思考の力をテストしているわけじゃないから
なんかカンニングしてるみたいな。答えだけ暗記して。
説明できないっていうね。
なんでこうなったのって説明できない。だから数学のテストでもねなんか式を書かなきゃいけないんだけど。
本当にそういう何か記憶しちゃってる状態になっちゃっていて単にそのパターン認識してるだけという状態になっているのではないかというのも指摘しています。
なんか人間と似てるっていうか。人間もある程度まではおおって頑張るけど一定のレベルに行くとああもう無理やみたいな。
これ以上頑張っても無理や。トークンの無駄だからもう考えろやめよう。
本当そんな感じですよね。なので結論としては既存のベンチマークに変わる何かしらなんかこう別の評価環境とか一定のものが必要なんじゃないかっていう感じの主張なのかな。
メタの新しいAIモデル
じゃあ次。
メタ物理世界を理解するAIVJEPA2を発表。メタは新しいワールドモデルVJEPA2を発表。動画ベースでの物体の動きや因果関係を学習するAIでロボティックスや自動運転など物理環境での応用を大きく前進させる可能性があります。
なんかロボット系?
そうですねなんかロボットとか自動運転とかに使えるモデルということなので今後メタがそっちの方に展開していくんじゃないかっていうことですね。
そうですね動画画像100万時間以上を活用して物体の動きとかなんかその重力がどうなってるかとか因果関係を理解。なんかこうぶつかったらこうなるとか。
そうですね。
そういうのを学習しているAIということなんですね。
このロボット実験で成功。未知環境でのピックアンドプレイス動作において成功率65から80%達成というのは初めて見た物体とかをこれ掴んでこっちにやってとかっていうのができたってことかな。
そうでしょうね。
そういえばGoogle IOでもそういう体験みたいなのがあって。そういえばその動画とか全然アップしてないわ。
なんかそれはジェミナイのだったのかなさすがに。中身は中身というかAIはジェミナイでそのロボットアームみたいなのがあっていろんな物体が置いてあってなんかこのタオルをこの何色のブロックの上にかけてくださいとかっていうふうに言うとそれやってくれるみたいな。
日本語でもできたんですよね。
結構動きはスムーズなんですか。
動きはスムーズだったと思いますね。だけどそうやって物の場所が変わったりするんだけどそれをまた認識して画像認識というか物体を認識してさらにそれを掴んだりできるみたいな感じだったんで。
ロボットアシスタントの例も出てるんですけどウェアラブルアシスタントもあるからレイバンメタとかに入ってレイバンメタのカメラで外の世界を見ていて例えば自転車とか乗ってるときに左側から車が来てますみたいなその危険性みたいなのを感知できるとかあるかもしれないですね。
いいですねそれ。
これでもオープンソースなんですかね。
ダウンロードできるけどすごいですね。
では次スケールAI新CEOにドロージー昇格、創業者ワングはメタへ合流。
スケールAIはCEOで創業者のアレクサンダーワン28歳がメタへ移籍するのに伴い現戦略責任者であるジェイソン・ドロージーを公認CEOに昇格させる計画を発表しました。
同時にメタが約150億ドルでスケールAIの49%を取得する大型投資も進行中です。
スケールAIという会社はですね、さっき言ってたVJEPPA2とかだとラベルなし動画を学習したっていうものなんですけど、ラベルをつける会社がスケールAIです。
いろんな学習元となるデータとかを綺麗に成形するみたいなことをやってる会社なんですけど、それは全部人間がやっているということで、ちょっとねいろいろとスキャンダルというかなんか訴訟を起こされたりとかして。
そうなんですか。
若干悪名高きって言えばいいのかな。
好感度が高くない。
そうですね、好感度そんなに高くないかもしれないこの会社は。
なぜかというといろんなデータを人間がチェックしなきゃいけないから、もちろんあんまりよろしくない動画とか画像を見なきゃいけない人がいるわけですよ。
それによってPTSDになりましたとか。
酷いですね。
そう、訴訟を起こされたりしてました。クラフスアクションとかも起こってました。
そうでしょうね。働くのつら。
結構マイクロマネージじゃないけど、働いてる人のめっちゃ細かいユーセージデータを撮ってたりとか、何分に1回画面のスクショ撮られたりとかして、ちゃんとやってんのみたいな。
それってリーガリーOKなんですかね。
どうなんですかね。でも会社の、会社のというか仕事のパソコンだといいのかな。でもそういう会社もありますよね。
そうそう、コロナだって。
みなさんマウスをさ、ジグルする。特にコロナ禍とか。
そうそう、やりましたよね。そっか、もしかしたらOKなのかもしれないけど、ちょっとやりすぎかな。
ちょっと嫌ですよね、普通に働いてる人からしたら。
嫌だ。
そんなことがあった会社で、でもメタが買収じゃないけど。
投資した?
大型投資して、でもアレクサンダーワンっていう、デザイナーと同じ名前だけどちょっとスペルが若干違う。
ちなみにデザイナーの方もめっちゃスキャンダル売られましたけどね。
確かに、アレクサンダーワンっていうのはあんまりいい名前じゃないのかな。
なんかそれであれかな、Eをなくしたとかあるのかな。
あるかも。
でも彼はメタ移籍するらしいです。
このスーパーインテリジェンツラボっていうのが新しく新設されて、そこに彼が行くということなのかな。
はいはいはい、そうですね。
あとそのGoogleからディープマインドの人も引き抜いたりとか。
次、ウェブを圧巻するリアルタイム取得AIボットの衝撃。
トールビットの最新レポートによると、AIモデルが必要な情報をリアルタイムでウェブから取得する新型ボットが急増し、
これにより従来の検索エンジン中心のウェブ構造が大きく変化しつつあります。
スケールAIの経営変動
特にAIによる要約や参照の需要が高まり、ニュース媒体への閲覧者トラフィック減少する一方、取得ボットのアクセスは劇的に伸びています。
まあそうなりますよねという感じではあるんですけれども。
みんながそのググって、ページを開いて、記事を読んでということをやらなくなっていると。
これ結構でも広告媒体もそうだし、メディアもちょっとつらたんという感じです。
ですよね。
2025年Q1第一四半期、ボットトラフィックは全四半世紀比で49%増加。
AI学習用スクレーピングより2.5倍の伸び。
そっかそもそも学習のためにもスクレーピングされてたのに、ユーザーにもスクレーピングされちゃうようになっちゃったっていう。
そうか。
多分いろいろとそのメディア側もね、ブロックしたりとかやってはいるところもあると思うんですけど、
逆にライセンシングして、タイムズ氏はAI企業にライセンス料を要求していたりとか。
そういうことをやったりしているけど、一つのところと提携してもね、他にもいっぱいあるから。
さらにGoogleもね、この前Google IOで、AIサーチだっけ。
今出てきてますね。
ベータ版出てると思うんですけど。
最初からGoogle検索のところじゃなくて、AIGoogle検索みたいなのを提供し始めているから。
どうなんでしょうね。
AI使って検索して、検索したその参照元が出てくるじゃないですか。
AIとメディアの影響
どのぐらいの割合の人がそれをちゃんと見に行っているのかなっていうのがちょっと気になる。
見ないですよね、全部見なくとも。
そうですよね。
やっぱり今まで消費者からすると、例えば10個のタブを全部開いて比べたりとかしなきゃいけなかったのが、
全部それを予約した状態で教えてくれるっていうのはやっぱり便利ですもんね。
ただその情報元があるからこそ便利になっているわけで、
彼らがビジネスできなくなっちゃったら困りますよね。
前その話しましたよね、情報をスクレープしすぎて取れる元が少なくなってるみたいな話ありました。
そうだし、メディアとして、広告収入をやっているところだったら広告収入が得られなくなっちゃったら、
潰れちゃうじゃないですか、単純に考えると。
単純に潰れちゃったらメディアがどんどんなくなって、新しい情報がインターネットに上がらなくなって、
古い情報を学習したAIとずっと話すみたいな。
Snapの新ARグラス
それこそディストピアですね。
ニュース媒体とかそういう今までのインターネットのビジネスモデルでやってたところは、
新しい何か違うビジネスモデルを試行錯誤する必要性が結構高まっているのではないでしょうか。
次、チャットGPTが火曜日にダウン。何が起きていたのか。
チャットGPTと連携サービスAPIやSORAIは、
2025年6月10日火曜日の午前中に世界的な大規模障害に見舞われ、
10時間以上にわたって部分的または完全に利用不可となりました。
はい、なんか落ちてましたね、チャットGPT。
私全然気づいてなくて、これ10日の午前3時から昼ぐらいまでってことですよね。
そうか、そうですね。
私はSNSとかスレーツとかでみんなが落ちてるみたいなのを見て、
落ちてるんだと思って、別のチャットで別のモデルを使ってました。
ちゃんと代わりがいるのは良いですね。
そうそう、いっぱいあるから。
これでもすごい影響が大きかったみたいですね。
これによって専門家や学生らが作業に、いや学業に支障をきたす事例が相次ぎ、
400万ユーザー規模の依存実態が浮き彫りになったと。
本当にこの2年ぐらいでね、仕事の仕方とか勉強の仕方とか、
ガラッと変わったんだろうなっていう感じがしますね。
こういうのを見ると。
今回そのチャットGPTだけが落ちてたから、私は別の使えばいいやって感じだったけど、
全部が一気になくなったら結構やばいかも。
そうか。
そういう意味でもやっぱりローカルにあるのは良いかもしれないですよね。
そうですね、あれその話は先週したんでしたっけ。
その話どこでしましたっけ。
どっかでした気がするんだけど。
先週か。
私が浜辺にハマっちゃった話ですけど。
トップ3でやばい時に使うローカルAI。
結構チャットGPTが落ちてるとかもそうじゃないですか。
トップ3でやばい時に。
本当そうだと思う。
そうか、じゃあみんなローカルにあるのはすごく良いという地平ですね。
そう、なんか避難バッグみたいな。
そういうのに入れとく感じで、ちょっとあったら便利なことがまたありましたね、事例が。
でもはもう復旧しているということです。
では次。
SNAPの次世代ARグラススペックスがメタのレーバーメタを超える理由。
SNAPは開発者向けに提供しているスペクタクルズ最新モデルから、
2026年に一般向けへと進化する新ARグラススペックスを発表。
軽量化とAI統合でメタのレーバーメタを大きくリードします。
レーバーメタはARではないですもんね。
そうですね。あれこれ、ゆかさんSNAPつけてませんでしたけど。
つけました。
ですよね。
メタのイベントで持ってる人がいて、つけさせてもらったんですけど、ちょっとやばかったです、サイズが。
すごいでっかい黒縁のね、存在感が。
すごいこれは、冗談みたいなデザインでしたけど、それとは別ってことですよね。
そうだと思います。
あれは開発者向けのデベロッパーキットみたいな感じだったんですけど、それとは違うけど、薄型、軽量化されているということです。
オープンAIはGeminiとの連携もあったりとか、ARもあるから現実世界にオーバーレイされるものが見えるというのがあるので、
深度認識したりとか、情報なりゲームなり、いろいろ現実世界と溶け合って見えるAR的な表示ができるということです。
ハンドトラッキングとか空間共有とかできるらしいですね。
とはいえ多分レイマンメタも今年出るのかな、どうなんですかね。
楽しみです。
でも出たとしてもARではないと思うからな。
そうか。
Googleの方と同じくスクリーンがついてるっていうだけで、なんかその深度があるみたいな感じではないんじゃないかと思っているので、
もしかしたらARという意味でスペックスがちょっと一歩リードできるかもしれないですが、
まだ価格とか、いつ発売とかは出てないので、また分かったら紹介します。
ラブブー人形の流行
はい。
じゃあ次。
クーンズレクソンバルーンドッグがスピーカートランプに変身。
ジェフ・クーンズの代表作バルーンドッグがレクソンデザインとブロード美術館とのコラボで機能的なアート作品へと進化。
11インチサイズのスピーカートランプがそれぞれBluetoothサウンドとLED照明を搭載し、アート性と実用性を兼ね揃えています。
ジェフ・クーンズのテカテカバルーンドッグがランプとスピーカーになって、なんか透けてる感じがめっちゃ可愛い。
可愛いですよねこれ。欲しいなと思ったら。
ちょっと欲しい?
750ドル。
なんか微妙ですよね。
微妙。
めっちゃ高いんだけど。
高いんだけど、絶妙だな。
絶妙な金額だなと思って。
だって一応ジェフ・クーンズの作品じゃないけど、オフィシャルコラボだし。
そう考えると安い?
ジェフ・クーンズの作品は何十億円とかじゃないですか。
そしてこの実用性あるからな。
そうなんですよ。
なんかこのスピーカーいいなと思ったの。
部屋のどこに置いてもオシャレみたいな。
スピーカーって基本一方通行っていうか、一方向に向いて置かれるじゃないですか。
でもこれは足のところについてるんですかね?
足の前面と背面みたいなところについてる感じですね。
じゃあ、部屋のど真ん中にドーンって置いたら?
そうそう、オシャレ。
でもランプもいいですね。
ランプもいい。いや、欲しい。
両方750ドルですか?
各750だから、2個買ったら1500ドルなんだな。
6月17日予約受付来週から出そうなので。
ちょっといいな。レクソンのウェブサイトからプリオーダーできるらしいので、もしご興味ある方はそちらをどうぞ。
じゃあそんな感じ?
そんな感じですね。
なんか盛りだくさんでしたね。
盛りだくさんだった。
ちょっと簡単に宣伝タイムさせてください。
先週発表させていただきました新しいユカスタポッドキャスト専用のYouTubeチャンネルができております。
まだチャンネル登録されてない方はぜひぜひチャンネル登録して盛り上げていただけると嬉しいです。
ちょっと新しいチャンネルになったこと気づいてない方もいっぱいいらっしゃる気がするので、ぜひこちらも応援してくれると嬉しいです。
あとユカスタではニュースレターをやっております。
私から月に一度ほどの頻度で希望的には皆さんにその月にあったこととかをまとめて送っています。
概要欄のリンクからぜひそちらも登録してみてください。
あとはユカスタのコミュニティもあります。
こちらは私のチャンネル、ユカスタポッドキャストのチャンネルじゃない方のチャンネルでメンバーシップ登録していただけると入れるコミュニティになっていて、
主な活動の場所はディスコードでほぼ毎日平日の朝と夜に黙々会をしたりとかしてとても楽しいコミュニティなのでぜひそちらもチェックしてください。
そしてユカスタのインスタとスレッツこちらもよかったらフォローしてください。
以上です。
じゃあ今週の小ネタはですね今ちょっと前からねすごいめっちゃ流行ってるラブブー人形についてのお話でございます。
ちなみにユカさんラブブー人形はお持ちでしょうか。
持ってないです。
私も持ってないんだけど。
これはあんまりちょっと私刺さってないんですよね。
私もこの前サントニオ行った時に偽物ラブブー人形がめっちゃ破格で売られてて。
なんか偽物ラフーフーってみんな言ってますね。
買わなかったんだけど。
ラブブー人形のお話です。
今回はですね中国のとある銀行のお話ですね。
平安銀行っていう銀行の一部の支店が50万円を定期預金として預けてくれるとラブブー人形をプレゼントしますっていうキャンペーンをやってたらしいんですけれども。
この度規制東京からやめなさいと言われてしまいましたというね。
すごい流行ってるからね。
みんなお金を銀行に預金してでもラブブー人形が欲しいっていう人が結構いたらしく。
でも別にプライズあげるよみたいなの自体は違法ではないんですよね。
多分物によるんだと思うんですけど。
家電とか会員券とかをあげますよっていうのは禁止されてるらしい。
その中にラブブー人形も入っちゃったんだけど。
あまりにも魅力的すぎる。
これちょっと本物か偽物かはわからないですよ。
わからないんだけど、銀行側もラブブー人形買い続けなきゃいけないから。
その辺のファイナンシャルのバランスもちょっとおかしくなっちゃうし、
一時的な加熱してるだけだったら預金したいっていう人ももしかしたら、
3ヶ月4ヶ月したらいなくなっちゃうかもしれないし、
みたいなあんまり良い政策っていうかキャンペーンではないので、
多分その辺を懸念して東京からやめなさいって言われたらしいんですけど。
すごいでもめっちゃいろんなところで見ますよね。
現実世界ではあまり見ないけどオンラインでね。
そうですね、現実世界そんな見ないかもな。
そんな見ないですよね。
マンハッタンとかにはいっぱいいそうだけど。
なんかアイジャスティーンがすごいピンクのラブブーとマックイベント行ってましたね。
行ってましたね。
ちょっとあそこまで行くとうーんってなっちゃうんだな。
でもみんななんか手にするとなんかコロリと言っちゃってる。
AppleのAI技術の分析
別に私大丈夫ですとか言ってたのになんか手にするとはーって。
なんか奇世界とか始める。
現実世界で巡り合ってしまったらもしかしたら欲しくなるかもしれない。
なのかな。
日本でも売れてるのかな。
どうなんですかね。
でも一番最初流行り始めたのってブラックピンクのリサだったかな。
が持っててそこから爆発したのでありそうだけど。
でもあんまり日本のそもそも日本のコンテンツが全然流れてこないからな。
そうか日本のセレブとかがどれだけ。
全然そういうのは見たことないですね。
このプロモーションのために金利が下がる。
そうですね。
小型家電とかいいんだ。
そうなんだ。
いいっていうか。
でもいいっていうか。
そういうのやめてくださいって。
ですねリザイヤーを圧迫する位置になってる。
そういうのを提供するために利益率がめっちゃ下がっていたりとか。
金利を下げちゃったりとかするのはもう元も子もない。
久しぶりに見たレッドノート。
うん確かにレッドノートで流行った。
流行ったっていうかバズったけどやめなさいと。
ちなみにこの前セブチラブブカーハートコラボやってました。
すごいですね。
情報量多くない?
カーハートってことはアパレルですか?
ちょっと本当によくわかんないんだけど、
まずファレルがジュピターっていうプラットフォームあるの知ってました?
知ってます。
オークション。
セレブの私物を変えるヤフオクみたいなのがあるんですけど、
この前ファレルとセブチがコラボ曲出したんですよ。
その流れなのか知らないけど、
ファレルのジュピターっていうプラットフォームの上でセブチのコラボグッズが出ますみたいなのが出てたんですけど、
まずサカイとコラボTシャツが出て、
それに全員のサインが入ってるみたいなのがあったり、
サカイとはまた関係なく、
ラブブとセブチとなぜかカーハート。
ラブブがカーハートの服着てるみたいな。
そういうことですね。
柿っぽい色なのかな。
そうそう。
それが13体。
13体。13人だから。
そう。だけど別にこれは誰バージョンとかそういう感じじゃないと思う。
ただ世界に13個ありますみたいな。
で、あとアンブッシュの。
アンブッシュとセブチのコラボでジュエリー。
すごいですね、コラボセブチ。
なんかすごいのよ。
なんかめっちゃ名前が多いの。
名前多い。
そうなんだ。確かにこのラブブ13体見てますけど、
どれも一緒に見える。
ですよね。
てか一緒なのか。
一緒なんだと思います。
これだからゆかさん触ったらもう欲しくなるやつですね。
かなぁ。
どうなんだろう。
ちょっと待って、ジュピッター今いくらになってます?
今ね、カレントビットが3700ドルとか4200ドルとか。
え、ラブブ?やば。
すごいですね。6月18日まで。
だから来週か。来週にビット締め切りなんですね。
しかもこれ服脱ぐと緑色なんですね。
そうみたい。
全部一緒の色なの。
全部緑なんだ。
あれでも、
あーそっか13体ね。
すごい謎。全部見たくなっちゃう。
いや、高。
高すぎでしょ。
一応ユネスコへの寄付。
これなんか1体はてなマークがいますよ。
どれでもいいのでちょっとクリックしていただいて。
一番下の画像に行くとはてなマークがある。
これやば。
え、じゃあ14人目がいるってこと?
うん、そうだと思う。
そうやってもなんか。
これはあれなんですってミステリアスなワンオブワン仕様で、
ファレルが愛用するサカイのアイテムに着想を得た他とは異なるカラーパターンらしい。
サカイとカーハートのコラボ。
そういうことらしい。
このラブグの服もダブルネームだった。
なるほど、なるほど。
だからファレル、カーハート、サカイ、背縁コラボのラブグ。
ということでちょっとクレイジーですね。
ファッションとセレブのコラボレーション
はい、クレイジーでした。
今週もイカサポッドキャストを最後までお聞きいただきありがとうございます。
今週のニュースの中で皆さんが気になったトピックは何でしたか?
ぜひコメント欄で教えてください。
それではまた次のエピソードでお会いしましょう。
バイバイ。
55:37

コメント

スクロール