1. わく枠べんきょ会
  2. #3 [News Check] Xiaomi新商品..
2024-09-04 22:18

#3 [News Check] Xiaomi新商品/Pixelズーム/ゲームプレイAI/安野さん

今日はニュースチェックの日。この1週間で気になった記事を持ち寄ります


- 谷口

- Pixelの「あとから写真をズームできる機能」を使ってみた

- https://gigazine.net/news/20240830-pixel-zoom-quality/

- Googleの研究チームがゲームエンジンとして機能するAIモデル「GameNGen」を発表、入力に合わせて20fpsでDOOMを描画可能で実際のプレイムービーもあり

- https://gigazine.net/news/20240829-google-gamengen-ai-model/


- 坂本

- NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー)

- https://www.techno-edge.net/article/2024/09/01/3626.html

- ⁠オードリー・タンと安野たかひろが語るデジタル戦略と社会課題の解決策|WebX2024⁠

- https://coinpost.jp/?p=554922

- ⁠OpenAIがアメリカ当局者に対し「Strawberry」と呼ばれる画期的な成果をデモ、コード名「Orion」という主力LLMのトレーニングデータを作成することでGPT-4越えの性能を目指す⁠

- https://gigazine.net/news/20240828-openai-strawberry-orion-chatbot/

⁠ - 絵で見てわかるLinuxカーネルの仕組み(市川 正美 大岩 尚弘 島本 裕志 武内 覚 田中 隆久 丸山 翔平)|翔泳社の本 (shoeisha.co.jp)⁠

- https://www.shoeisha.co.jp/book/detail/9784798177847

- ⁠xiaomi 新製品発売8月⁠

- https://event.mi.com/jp/lifetstyle-colloection-202408

- 本編で扱わなかった記事

⁠ - ASCII.jp:「リアルすぎる」と話題 グーグル画像生成AI「ImageFX」の使い方⁠

- ⁠2024.08.30Gemini の応答が高速に⁠

- ⁠話題のFLUX.1をComfyUIで画像生成してみる!基本系とControlNetのWorkflow(json)公開⁠

- ⁠「オープンソースAI」問題ついに決着、OSIが定義を発表⁠

- ⁠OpenAI・Amazon・Microsoftなどの大手IT企業が「AI生成コンテンツへのラベル付与を義務付ける法案」に賛同⁠

- ⁠Raspberry Pi PicoとRaspberry Pi Pico 2の性能比較⁠

- ⁠A/Bテストよりすごい?はじめてのインターリービング - Gunosyデータ分析ブログ⁠

- ⁠Amazonは生成AIアシスタントで開発者4500人年の工数を節約し、年間2億6000万ドルもの効率向上を実現したって? - YAMDAS現更新履歴⁠






presentor

- taniguchi

- sakamoto (mossan-hoshi) https://x.com/mossan_hoshi

00:02
えーと、9月2日ですね。今日はちょっとニュースチェックやっていきましょうか。
はい。あ、そうだ。ちょっとまあ最初に細かいところではありますけれども、少しあのマイク、ちょっと設定というか変えてみたんですけれども、前回に比べてどうですかね、聞こえ具合は。
そうですね、正直あんまり、なんか変わりはないようですね。
わかりました。ちょっとまあいいや。じゃあ一旦ちょっとお家で進めてみますね。はい。
じゃあどうしましょうかね。とりあえず上から順に行きましょうか。
はい。えっと確かGoogleのPixel、あ、そうです。あの本当にすいません、あのギガ人の記事2つなんですけども、
はい。はい。えっとまあ気になったのが、まあ一つこの後から写真をズームできる機能っていうのがもう実装されている。
たぶん実装、あのもう使えると思うんですけど、これでそのまあ後からあのズームできる機能があるんだなっていうのと、
えっとまあ後半の方に行くと文字が潰れてしまうというか、あのぐじゃぐじゃ、なんかよくわかんない文字で、
あ、その辺ですね、川、あ、もっと下ですかね。そうですね、そこはコーラスジェットってしっかり言葉として出てるんですけど、
あ、そこですよ、そのバーベキューっていうのがもうよくわかんない文字で出てきてるってことは、
そのなんて言うんですかね、そのAIとしてこの文字はこういう文字っていう風に認識して、その文字で出すからくっきりできるっていう風な機能なのかなっていうのを。
そうですね、えっと確かこれ30倍ぐらいだったと思うんですけれども、えっとまあ途中までは音楽で頑張るんですけれども、
さすがにあの小さいボディに30倍は言えりゃないんで、そこに関してはまあそうですね、まあ普通にAIで超解像してますよって感じですね。
まあそもそもこの超解像されたやつは結構ヌルヌルした感じの絵になってるんで、まあなんかそういうAI的なやつ使ってるなっていうのがわからんでもないんですけど。
まあなので結構用途次第だかなというふうには思いますね、本当に。
なるほどです。まあでもなんかあれですよね、もう将来ここはこういうオブジェクトだからこういう風に描画されるだろうっていう感じで、正しくはないかもしれないんですけど、
アップでやってもくっきりさらにうまくできそうな感じはするなっていうのは。
そうですね、まあなので適当に撮って結構そこまでいける、まあもしくはスマホでそこまでズームしてできるってところがやっぱ売りなのかなと思います。
まあ実際そんなにそう厳密になんかすごくちゃんとした絵を撮りたいっていう人、まあそこまでいるのかっていうところは確かにあるんで、まあこれぐらいでもいいのかなーって気はしなくて。
そうですね、スマホの機能なのでなんかあくまでその楽しむ機能みたいなレベルのところで、はいあー面白いなーっていうのはありました。
03:01
そうですよね。
はい、というのが一つです。
はい、ありがとうございます。
はい、もうコードなんかありますんで、せっかくなんでやっときましょう。
はい、でもう一つが、まあちゃんと内容まだ理解できなかったんですけど。
はい。
いわゆるゲームプレイ系のAIですね。
はい、これが入力に合わせてDoomっていうゲームを描画可能ということで、文章を読んだんですけど、
そうですね、この何もないところから敵や弾が出現したり、壊したオブジェクトが復活するような精々AIっぽさっていうのはあれですかね。
これってあれじゃないですか、普通にゲームプレイするAIですよっていうのがじゃないんですかね。
まあ昔からあるので、タスクとしては強化学習の一種かなと思っていて。
あれってオープンAIだったっけな。
オープンAIかもしれない。
まあ別に強化学習自体はどうでもあるんですけど。
強化学習って、いわゆるロボットの操作とかですね。
そういったところでよく使われているやつではありますけれどもですね。
これ、こういうとこですよね。
オープンAIゲームっていうのがあってですね。
こいつはそういったAIをプレイする強化学習の、それをトレーニングするためのプラットフォームみたいな感じのツーブですね。
ここでまあまあね、こういった感じですね。
これ本当に昔からあった、1980年代とか70年代くらいの古いゲームとかをプレイさせる。
これだとバランスを取りながら多分肌と肌の間に落ちてくるといいですよってやつなんでしょう。
これは何回も何回も何千回も繰り返すことでじわじわゲームプレイがAITに上手くなっていくようになります。
こういった感じで何千回も試行しながら、こういう条件のときはこういうふうに。
なんかちょっと多分以前やらなかったでしたっけ。
強化学習、現状の環境を理解して、その上でどういうふうなプラン、方策ってやつを決めて、
それでその行動に対して、目標に対してどんだけ近づいたかってところで報酬がもらえるっていうのを、
そのループをひたすら繰り返すことで報酬が最大化するような行動をトリローになるよっていうのがされたやつですよね。
それなんですけれども、それが所詮AIなんでですね、結局リアルタイム性がなかなか難しいよねってなんですけど、
それがもうこの20fpsなんで1秒間に20フレーム、この画面見て、
じゃあ次はどういうふうに行動すればいいのかっていうのを判断して、キー操作してっていうのをひたすら繰り返せるやつが出てきたってことかなと思いますね、このGear Gのやつは。
はい。さっきのモノの超高性能版みたいなのがこれなんですか。
06:03
このコムKフだと思いますよ。詳しく見てないんであれですけど、
まとめ普通に強化学習系のモデルなのかなということで。
そうですね、下にそういう文字というか文言も出てきてます。強化学習エージェントって書いてるんで。
まあでもステビルVCGのベースに同のコマ乗ってやってるんですね。
なんか今風です。
もしもーい。いろいろ考えますね。
具体的などういうふうに繋げてるのかわからないですけど。
でもそんだけ早くできるんですね。
私のほうですね、ちょっとざっと適当に並べているんで、特にどれが重要というわけではないんですが、
まあちょっといくつかピックアップしていきたいと思います。
正直そんな読んでないやつもあったりするんで、あれなんですけれどもですね。
一つ目はですね、テクマエッジっていう技術系の記事を出しているところが、
毎週AI系の記事を気になったやつというか、いくつか紹介するっていう記事なんですけれども。
だいたいここぐらいかな。
この中だと、そうですね。
アートステアスですね。これは魚AIというとこ。
日本にある魚AIっていう結構有名なAIのベンチャーがありますけれども、
あそこが作ったやつで、論文というか研究開発をそのまままるで論文出すとこまで全部やるよっていうようなAIですね。
実験の条件とかやその結果を見た上で、その次どういうふうにアクションするか決めて、
実際それで成果が出るまで続けて、最終的にその論文を作るっていうところまでやるっていう、
本当かよっていう感じのやつですけれどもですね。
そういうやつですよって感じですね。
これできてくると。開発もだって基本的には予定後同じようなものなんで、すごいなってところではありましたね。
やばいですね。
実際どの程度で出てくるかですけれども。
あともう1個気になったのが、長時間動画を理解できる視覚言語モデルのロングVILをNVIDIAが開発というようなところで、
画像だとか動画に対してこれをコンテキストに入れてLLMとかでコミュニケーションを取るっていうやつで、
画像とかは普通に今はできるんですけれども、
動画ってなってくると、なかなかその動画がどういう情報を含んでいるかって、
うまく落とし込めないんで、
基本的にはそんな扱えないかったりするっていうのは一般的なんですけれども、
09:01
多分そこら辺もこの動画についてどうのこうのっていうのをコミュニケーションできるようになっているのかなというところですね。
ただ今のところフレーム数でいうと256フレームというか1024フレームぐらいで、まだまだというところはあります。
だから30分とか1時間の動画をそのまま丸と1回入れてというところまではいかないと。
実際動画の情報では低下しないんで、なかなか難しいタスクだとは思います。
そこら辺どうやってやってるんですかね。
でも今後はそういう動画も扱えるようになってくる可能性はありますよね。
次の記事いきましょうか。
ちょっと技術系と言えば技術系だし、そうじゃないと言えばそうじゃないんで、ちょっとあれではありますけれどもですね。
記事でして、庵野孝博氏というですね。
7月ぐらいでしたっけ、都知事選ありましたけども。
もともとAIで有名な松岡園から出てきたのかな。
ちょっとあんまり詳しい偈愛ですけども。
とりあえずAI強々のエンジニアの人で、自分で企業も立ち上げてみたいなことをやってる人ですね。
その人が出馬したんですけども、じゃあなんでエンジニアが出馬したのかというようなところで言うと、
いわゆる政策としてこれをスゲーをしたいというよりは、どっちかというとシステムを何とかしたいというような、そういったイメージだと思っていただければよくてですね。
はい。
結局今って何か、いわゆる大議員というか、都知事、議員だったら議員挙げて、
そこから何か、じゃあそれぞれの国民だとか市民の身を広ぐというパスがなかなかなかったりするんですけども、
そこをうまく意見を広い上げつつも、ただ国民だとか市民の人って人数としてはえげつない量いるんで、
そこをどういう風に交通整理しながら合意を形成していくかみたいなところ、
そこを何かテクノロジーの力で何とかならないかなというような感じ。
ざっくり言うとそんな感じのアプローチ。
で、だいぶアプローチの仕方としてはですね、GitHubだとかで、
イシューを上げてそれに対してコミュニケーションして、バグを修正、もしくは機能を追加していくというようなやり方。
一般的なやり方ですね。
そういったやり方に近いアプローチを取ってあげるというところで、
これ実際に都知事選の時にそういったサイトを作ってですね、
じゃあ都知事になった時にどういった政策は欲しいですかっていうところを、
各都民の人からこういうことが問題で、こういったこと対策してほしいですってところを
何かイシューとしてあげてもらって、そこで議論して、
12:02
どういうふうにしましょうかってところを落とし方みたいなところをやってたっていうところがあるんですよね。
この人はちょっとオードリーターンが何で出てきてるのかっていうと、
実はオードリーターンの人と繋がりがあって、
それやる時にオードリーターンにどういうふうにやるといいですかねってところを聞いたっていうところがあって、
その次第でこれWebEx 2024っていうイベントで改めて対談があったって感じですね。
なのであまり政治家ってよりは本当にシステムを何とかすべきというイメージではあるんですけど、
そういう意味でちょっと面白いかなと思って見てはいるんですけれども、そこら辺の話ですね。
記事は細かいところはあれですけれども、
でも語ってる内容はほぼほぼ今話したようなところかなと思いますね。
結局誰も取り残さないって言って、
そういうふうに一周あげようと思ったらあげれるっていうよ、
誰でもあげれるよっていうようなところに持ってくると。
あとはコミュニティのための技術化というところが書かれていますよっていうところかな。
こんな感じで今の技術を使って本当にシステムを最適化しましょうっていうような、
そういったシステムと後合意形成を最適化しましょうっていうようなイメージを書いているってことですね。
こういう流れはちょっと面白いんで、
なかなか政治の話だと単純に誰にどれだけリソースを配分するかみたいな話になりがちなんですけど、
ここら辺で最終的にはそういうふうなリソースをどこに持ってくかという意思決定ではあるんですけれども、
そのプロセスの部分を透明化してどうするかというところがちょっと改善されるので面白そうかなと思いますね。
次ですね、これちょっと前に話しましたよね。
OpenAIのサム・アルトンさんとツイッターで苺育てて、
どのコーナーどのコーナーみたいになっちゃいましたけども、
あそこら辺のやつをアメリカの当局にデモしたヤマシタエゴってところで、
それのコードネームがストロベリーですよっていうらしいですね。
そういうようなところで、正直それ以上は特に情報ないんですけれどもですね。
そんな感じで次世代のやつはいろいろ準備できてますよってところですね。
面白そうですね。一切どんぐらい進むのかなっていうところはいいんですけれども。
気になりますね。
次ですね。ちょっと時間の要請が入り、もう2、3期次ぐらいいきますと。
ちょっと気になったフォント紹介で、
Aで見てわかるLinux Kernelの仕組みってやつでして、
15:00
単純に面白そうだなと思ったのでシェアさせていただきました。
Linux KernelなんかあんまりわかんないままLinux使ってはいるんで、
やっぱりそこら辺がわかりやすく出してくれればいいなと思いつつも、
こういうAで見てわかる系のやつって本当に見て本当にわかりやすいっていうパターンと、
そうじゃないパターンがあるんで、実際どうなんだろうなっていうのがちょっと気になっているところではありますね。
特に著者が複数にいる場合なんで、なかなか全体の統一性とかそこら辺どうなんだろうっていうのもちょっと気になっているところではあるんで。
6人いるんですか。
別にそういう珍しいことではないんですけれども。
それがどんだけ本のクオリティが出てくるかっていうのはちょっと実際見てみないとわかんないなと思いつつ、
ちょっと本屋とかで見かけたらちょっと見てみたいなっていうやつですね。
ちょっと待って、あとは画像生成AI系が多いけどあんまりごみはないかな。
そうですね、これとかちょっと以前話しましたけど、コミファAIのやつですね、コモファAIかな。
これはちょっと別途ちょっと学習イベントとしてやりましょう。
そうですね、コモファAIはちょっと軽く使ってみたいなと思ってるんで。
それはやりたいか。
あ、そうだ、これは話したかったんだ。
そういえばXiaomiがなんか新しいやついろいろ発表してましたよね。
スマホですかね。
いや、スマホじゃないです。スマホ以外の家電系ですね、大体。
Xiaomi結構家電も作ってるんで、そこら辺をいろいろ発表してましたね。
まずはテレビ柄で、結構43イチ以上っていう結構でかい目のサイズだけをひたすら。
テレビで言ってもチューナレスモデルですんで、テレビは見れないですね。
こういった感じであまり縁も薄いですし、なんか本当に今風なやつですね。
43イチで3万円というところでだいぶ安いですね。
結構えげつないやつですね。
そうですね、43イチでそれぐらいで。
もちろんGoogle TVが入ってますし、解像度も4Kですよと。
なので、なかなかいい感じ。
一応OK、Googleで使いますよと。
で、量子ドットなんで。
まあ、ジオフショット実際どの程度綺麗なのか一応分かってないですけど。
まあ悪くないじゃろうというようなことが書かれてる。
まあ値段から見たら絶対安いでしょうねっていうようなやつですね。
とりあえず今回テレビ系は一押しが43イチで3万円ですよというのが一番安いですね。
結構いろいろやっててですね。
ロボット掃除機とかも作ってるんですよね。
エントリーモデルだと2万5千円ぐらいからというところでだいぶ安くて。
18:00
ロボット掃除機も結構技術が枯れてはないですけども成熟してはしてるんで。
こんだけ安くできんだなという感じがしますけどね。
機能としては一般的なロボット掃除機なんでいい感じですけどね。
あとちょっと上位モデルになると確か水拭きもできたような気がしますね。
確かいわゆる空拭きと水拭き両方できるよってやつがあった気がするんだわ。
最上位モデルだけかな。
どうなんですかね。カビとか。
別にそれはタンクに水入れてやるだけなんで。
そこを掃除しておけば大丈夫だと思いますけどね。
こんな感じかな。こんな感じですね。
ステーション側にタンク入れておけば水の補充とかもやってくれるんで
いい感じにできますよって感じです。
水拭きのやつに関しては一番有名なロボット掃除機の会社がありますけど。
ルンバ。
ルンバですね。ルンバも昔そういう商品がグラーバーってやつがあったりするんで。
別にそれ自体は結構昔からあれはあるんで。
それをただ一体化するってところがやっぱりなかなかあれだったんですけども。
今はルンバは最上位機種ぐらいだったら一体化してたりするんで。
結構そういうのに近いことをやってきて。
値段は多分半分以下だと思うんで。だいぶ安いねって認識してますね。
水拭きできる一体化。ルンバのメーカーじゃなかったかもしれないんですけど。
20万近くっていうのも前見たような気がするんで。
高いですよね結構ね。
高いんですよね。
実際使うにあたっていろいろ工夫というかですね。
機能としてはそっちのほうが優れてるっていうのはあるんでしょうけど。
とりあえず最初に試してみたっていうなら一番高くても5万円ぐらいなんでだいぶ安い。
あとそれ以外にもちょっと時間なんで早々といきますけど。
ペット用の餌やり機だとか監視カメラこれ安いっしょマジで。
スマートカメラが3000円で。
これは何か使うわけじゃないけどとりあえず買っておこうかなぐらいに。
おもちゃとして全然安い。
おもちゃとして全然安いなという感じはしますよね。
あと炊飯器だとかBluetoothスピーカーとか結構いろいろやってますよね。
あといわゆるゲーミングモニターですね。
24インチとか27インチのやつとかそういったモニターもあります。
安いですね。実際どの程度いい感じなのかわからないですけど。
ただ個人的にはちょっと監視がやっぱり特に会社のポスコンとか繋げる際に
USBのタイプCがあるやつが個人的には嬉しいんですけど
なかなかこういうのはついてなかったりするんで。
一般的なHDMIとかそこらへん繋ぐタイプのやつかなというところですね。
安いやすいですよ普通に。
それ以外はあと照明とかがありますよって感じで。
ちょっとちょうど時間なんでいいかなと。
こんな感じでXiaomiもいろんな商品出してきましたよっていう感じですね。
21:02
めっちゃ面白いかなと思います。
セミさんちょっと時間になりましたがどうですかね。
今日のやつ見てきて何かありますかね。
はい。さっきの直近のXiaomiがいろいろ出してたんだなっていうのもありますし。
スマホとスマートウォッチのイメージしかなかったんで。
結構なんかいろいろ手開くやり始めてますね。
その時に全体的に見やすいのはすごいなと思いましたよね。
はい。すごい。
あとXiaomiじゃない中国メーカーでファーウェイとかも出してそうだなというのは聞いてて。
どうなんですかね。
企業規模としてはだいぶデカいんでやっててもらうしかないですよね。
そんなわけでたまにはこういうのを見て買わないまでもトレンドを抑えるのはいいかなと思いますね。
今これぐらいで買えるんだなっていう。
そうですね。
じゃあちょっと今日ちょうど時間になりましたんでこれで終わろうかと思います。
お疲れ様でした。
ありがとうございました。
22:18

コメント

スクロール