1. おちつきAIラジオ
  2. [9月30日]3Dモデルの民主化”Hi..
2025-09-30 1:07:12

[9月30日]3Dモデルの民主化”Hitem3D” すごさの核心はAI自体じゃないんです(ep.3)

spotify apple_podcasts

AIが3Dモデルを作る――その裏には、10年以上にわたる開発者たちの試行錯誤の物語がありました。今回のテーマは、話題の3D生成AI「Hitem3D」。このツールを支えるコア技術「Sparc3D」のすごさを、AIエンジニアしぶちょーが歴史を遡って解説します。すべては、立体をマインクラフトのようなブロックの塊で表現する「ボクセル」から始まりました。しかし、データ量が爆発する壁にぶつかり、次は形でなく「設計図(数式)」で表現する「インプリシット表現」が発明されます。それでも残った課題を乗り越えるため、開発者たちは再び原点に戻り…。まるで映画のような技術の進化のストーリーを知ると、AIニュースの見方がガラリと変わるはず。驚きの裏にある、ものづくりのロマンに触れるひとときをお届けします。


【目次】

() オープニング|なぜ画像から3Dモデルが生成できるのか?

() 最近話題のAIツール「Hitem3D」とは?

() 驚くべきクオリティ向上!過去の3D生成AIとの違い

() 複数視点の画像で精度アップ!「nano banana」との最強コンボ

() その驚き方、間違ってる?Hitem3Dの本当のすごさ

() すごいのはAIじゃない!コア技術「Sparc3D」の正体

() AIは3Dをどう理解する?マインクラフトみたいな「ボクセル」表現

() データ量問題を解決した「インプリシット表現」という発明

() 「伝言ゲーム」の限界。なぜ変換すると情報が劣化するのか?

() 原点回帰と革新!「Sparc3D」のハイブリッドな発想

() 必要なのは表面だけ?データ量を削減するスパースな考え方

() 情報劣化を防ぐ専用パイプ!3DデータをAIに伝える仕組み

() 結論:革新はAIの脳みそではなく「パイプライン」にあった

() なぜ顔がゾンビに?かねりんがHitem3Dを実践レビュー

() 3Dモデル生成技術の未来と「ものづくりの民主化」とは?

() しぶちょーによる3Dプリンターの熱烈セールストーク

() AIの進化を正しく理解すれば、もっと面白くなる!


【今回の放送回に関連するリンク】

Hitem3D

https://hitem3d.ai/

Sparc3D論文https://arxiv.org/pdf/2505.14521


—----------------------------

【番組の概要】

日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。

★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。★

【番組公式ハッシュタグ】

#おちつきAI

【番組公式X】

https://x.com/ochitsuki_AI


【パーソナリティ(MC)】

▼しぶちょー

・AIエンジニア

・技術士(機械部門) 

「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。

情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。

著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」

https://x.com/sibucho_labo

https://voicy.jp/channel/3963

▼かねりん(金田勇太)

・KANERIN Podcast Studios 代表

・一般社団法人 地方WEB3連携協会 理事

「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション『KANERIN Podcast Studios』を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」

https://x.com/kanerinx

https://voicy.jp/channel/2534


【プロデューサー】

かねりん https://x.com/kanerinx

【サウンド・アーキテクト】

Aviv Haruta https://x.com/oji_pal

【カバーアートデザイン】

UTA https://x.com/uta_dib

【制作/著作】

KANERIN Podcast Studios


--------------------------------------------------

※画像引用元:https://hitem3d.ai/

【各種ポッドキャストスタンドへのリンク】

Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2o

Apple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430

Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/

YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD


サマリー

Hitem3Dは、画像を入力することで高品質な3Dモデルを生成するAIツールです。このポッドキャストでは、Hitem3Dのクオリティの高さや、支える技術の背景について詳しく解説され、驚くべき点はAIそのものではなく、データの扱い方にあることが伝えられます。エピソードでは、3Dモデルの民主化におけるAIの役割について議論され、特にVoxelとインプリシット表現の進化とその限界が紹介されます。最終的には、新たな技術スパーク3Dが3Dモデルの伝達精度を向上させる可能性が意識されます。このエピソードでは、3Dモデルの民主化を進める技術「スパーク3D」について詳しく掘り下げられ、AI自体ではなく、独自に設計されたパイプラインの革新が核心であることが強調されます。また、3Dモデルの民主化とAIの進化について議論され、特にインプリシット表現とボクセルの技術がどのように3D生成に影響を与えるか、メタバースにおける3Dモデルの重要性が強調されます。さらに、3Dプリンターの普及により3Dモデルの民主化が進み、「Hitem3D」のようなサービスの登場によってデータとしての形状扱いが容易になり、物作りをする楽しみが広がったことが述べられます。AIの技術の進展についても触れられ、過度な期待を持たずに理解を深めることの重要性が語られます。Hitem3Dは3Dモデルの普及を促進する技術であり、その核心にあるのはAIではなくコミュニティの力です。

Hitem3Dの概要
おちつきAI
AIエンジニアのしぶちょーです。
AI素人のかねりんです。
この番組は、日々のAIニュースで驚き疲れたあなたに、一度落ち着いていただいて、ゆっくりじっくり、AIを学ぶ時間をお届けする、そんな番組でございます。
はい、ということで、今日もおちつきAI始まってしまいましたけども、やっていきましょう。
はい、お願いします。
ということで、早速なんですけど、今日のトピック、こちらです。
なぜ画像から3Dモデルが生成できるのか?というテーマでございます。
はい。3Dモデルね。
そう、3Dモデルです。今日テーマにするのは、最近話題で界隈を驚かしているですね、Hitem3Dというツールになります。
Hitem3D。
そう、Hitem3D。これ、かねりんにさ、事前に使ってって言ったけど、使った?
使いましたよ。
よかった。
怖い怖い怖い。これでいつか。
これ使ってないって言ったら。
忘れてた。
とか言った日どうなるんだろうって今思った。
そしたら、今日はありがとうございました。3分で終わります、番組が。
怖い怖い。超プレッシャー。使ってみたよ。
使ってみました?
普通に無料でやる分でいいんでしょ?クレジット。
そう、無料でやる分でいい。
よかったよかった。課金してねえのかって言われるから。
無限に課金できるからね。
新しいアカウント作ってってこと?
いやいや、課金しようと思ったら、いくらでも課金できちゃうからね。
あ、課金ね。そうだよね。そして解除するの忘れる。
そうそうそう。
じゃあちょっとね、このハイテム3Dっていうのは、説明すると、画像を入れると3Dモデルを生成してくれるっていうAI。
いやいやいや。
まあなんかありそうでなかったの?
いや、今までね、あった。ずっとあったのよ。
一応ね、画像を入れたら、立体のCGみたいな3Dモデル、生成できるよっていうのがあったんだけど。
あったよね?たぶんね。
あった。
なんか見たことある気はするよ。
そう、結構ね、ずっとある。2年前ぐらいから。
結構あるね。で、それが何、今さらわは言われてるのは、何なの?
めちゃくちゃクオリティがあったのよ。
マジで?
カネリンは、たぶんこっから入ったから、あ、できたって驚けてないと思うんだけど、違うのよ。
なるほどね。
僕さ、物作る人じゃん。フィジカルな物、3Dプリンターとか好きじゃん。
そうだよね。
だからこの3Dモデルが生成アイでできるって、激アツなのね。
いや本当さ、なんかさ、支部長はもう3Dプリンターの人みたいになってるじゃん?
3Dプリンターの人目指してるみたいなとこあるしね。
そう、何度売り付けられそうになったかっていうぐらいさ。
だからさ、たまに支部長のツイートとか見てもさ、これは何、3D文脈でなんか騒いでんのか、AI文脈がすごいって言ってんのか、どっちなのかなって思ってました。
両方。
両方なんだ。
基本的には3Dプリンターすごいよって言ってるし、なんなら今日もちょっと後半売り付けようかなって思ってたんだけど、それは後半の楽しみにしておいて。
でもそのね、3Dモデルをなんかさ、いろんなソフトを使って作って印刷するっていうのが当たり前だったんだけど、画像を入れたらもう3Dモデルがポンとできてしまうと。
なるほどね。
で、それそのままバンって印刷したら、なんかフィギュアみたいなのができるよっていう世界に今なっちゃってる。
これってこの間のナノバナナの赤ちゃんのフィギュアの話とは全然別?
別なんだけど、別なんだけどちょっと繋がってんのよ。
えー。
このハイテム3Dっていうのは何がすごいかっていうと、クオリティがすごいのね。とにかく画像を入れたときに成功に3Dモデルができてくると。今までやんないぐらい。
3D生成の技術
3Dモデルって言われるのは立体の映像ってこと?
そう。立体の形を持ったデータ。
それって、例えばそのまま3Dプリンター使えるみたいなこと?
そう。
えーすごいね。
カネリンがハイテム3Dに画像何か、何入れたかわかんないけど何か入れて出てきたでしょ?立体が。
そう出てきた。
それそのまま3Dプリンターでぶち込めんの。
へーすごいね。
で、そのままの形で出てくる。だからもう形としてのデータを出せますよっていうアイテムなのね。
なるほど。じゃあそれさ、ナノバナナで3D赤ちゃん作って、それをハイテム3D入れて綺麗に出してってやったらいいんじゃないの?
そう。そうなのよ。で、ハイテム3Dの方が早かった、出てるのが。
これね、7月ぐらいに話題になったのね、今年の。
7月?
そう、7月ぐらいに話題になって、すごい成功にできるよねってなっていって、で、ナノバナナ出てきたでしょ?
で、ナノバナナってさ、すごくフィギュアの画像ボンって出してくれたりとか、そのフィギュアの画像に対して、
このフィギュアの右から見た画像を作ってって言ったら、作ってくれるの。
それはナノバナナで?
ナノバナナで。で、ハイテム3Dは正面から見た図とか、右から見た絵とかを入れれば、より成功に立体が作れるのね。
あの複数視点から3Dへっていうモードこれ?
そう。
あーそれね、やってないんだけど、これやったらすごいのかなって思って。
そう、これやったらすごいし、その、じゃあこれ右側から見た図って、なかなか手に入らないなって。現物がないと。
そうね。
でもナノバナナは、これ右から見た図出してって言ったらすぐ出してくるのよ。
その組み合わせでやべえことになるってこと?
そう、その組み合わせで、よりこう注目が集まったというか、これできるじゃんみたいな感じで、界隈でナノバナナとの組み合わせで、ハイテム3Dが結構バズってた。
なるほどね。
これ、ハイテム3Dのその複数視点モードっていうのはもともとあった?
これもう、これ統合する?視点を統合するっていうのはもともとあった。
でもまあ活かせないよね。その複数視点が、素材がないとね。
そう、今まで右から見た図って言ったら、全然さ格好も違うような画像が出てきちゃったら統合しようがないじゃん。
だけど、破綻なく右から見た図が簡単にナノバナナ出せるから。
なるほどね。
3Dモデルが成功にできるようになったし、なんかフィギュアの画像を作るのがさ、バズったじゃん。
じゃあこのフィギュア実際に作ってみたいねってなるじゃん。
そうだね。
それが実際これでできるっていうので、すごいよねっていう風になってると。
なるほど、ナノバナナでブーストされた感じだ、この子。
そう、ブーストされて、3Dプリンター界隈でも、3Dモデル界隈でもすごいと。
データの扱い方
とにかく成功にできるようになったと。
すごいAIが出てきたな、ハイテム3Dっていう風に驚いてんだけど。
これは驚いていいやつ?
驚いていい、このクオリティは驚いていいが。
が?
いいが、ちょっとね驚き間違ってんだよ。
驚き方間違ってるってこと?
驚き間違ってる。
まじかね。
このね、ハイテム3Dのすごさっていうのは、これ実はAIのすごさじゃないのよ。
そうなの?
違う。技術の根本はAIじゃないんだよ。
AIじゃないの?
なんかさ、すごいそういう3Dを生成するとんでもないAIが作られたっていう感じでみんな驚いてるんだけど、
違うんですね。
違う。
違う。
今日はね、ここをね、落ち着いて説明していきたいところ。
それめっちゃ落ち着きじゃん。
AIすげえってなってるところに、いやいやAIじゃねえよって話。
そう、違うよ。ポイントはね、AIの部分じゃないんですよと。
そういう話です、今日は。
ちょっと冷や水ぶっかけ系だね。
そうそう。正しくね、驚いてほしいなっていうのがあって、今日はその話。
厳しいね、やっぱ。
厳しくないよ、別に。
しぶちょく厳しい。
違う違う、面白いんだって。
うん、なるほどね。
ここが面白いんだよってこと?
分かったら面白いってことね。
面白い面白い。なるほどねってなるから。そういう番組だから。
そうか、叱られるんかと思ってた。なるほどなるほど。
大丈夫大丈夫。
平和だね。
そう、平和に。
ついやっぱりなんかこう怒られるんじゃないかって構えるからね、やっぱ。じげえよって言われるとさ。
いや、そんなね。僕こういう大人しい、穏やかな感じで売ってるから。
そう。
大丈夫大丈夫。
だっけ、あ、そうだね。
そうだよ、そんな激しいこと言わないよ。
ごめんごめん。ちょっと今まで付き合ったことないタイプの人だもんで。
包み込む感じで。みんなを包み込む感じで。みんな大好きだよーっていう感じで喋ってるから。
大好きだよ。
だからみんな安心して聞けるわけ。
分かりました。包み込まれますよ、僕も。
いやちょっとね、まずハイテム3Dこいつなんなんっていうかどういうサービスなんっていうのから、簡単に説明するんだけど。
これね、もともとスパーク3Dっていう技術が開発されたと。スパーク3Dっていう名前の技術が大学とかそういうとこが連携して開発されたよっていうのがあると。
これトップページにも書いてあるね、それ。
そうでしょ、スパーク3Dって書いてあるでしょ。
スパーク3D。
そのスパーク3Dっていう新しく作った仕組みを使ってサービスにしたのがハイテム3Dだろうね。
サービス名がハイテム3Dで、その裏にある技術がスパーク3Dっていう。そういうふうに思ってもらえればOK。
今日説明するのは、ハイテム3Dの裏にいるスパーク3Dってなんなんっていう話ね。
もともとこれが2025年の5月にスパーク3Dっていう方式を開発しましたっていう論文が出ていて。
結構最近だね。
最近、5月。で、その時にすごいもう、あ、界隈で、まだそんなにバズってはなかったんだけど、3D生成の分野ではすごいのが出てきたと。
こんな成功に3Dモデルが生成できるんだっていうので話題になっていって、7月初旬にサービス、ハイテム3Dとしてサービス化したと。
こういう流れがあるのね。
で、今日はこのスパーク3Dの説明をするんだけど、これはポイントはさっきも言ったようにAIじゃないんだよ。
何かって言ったら、どうやって3DのモデルをAIに渡してるんですかっていう部分。
それのパイプラインって言うんだけど、AIって脳みそだと思ってね。脳みそあるじゃん。そこに3Dモデルをどうやって理解させるか。
そのパイプライン、脳みそに3Dモデルをぶち込むそのパイプにコアがあるのね。
情報の渡し方ってこと?
そう、3Dをどうやってデータとして扱うかっていうのにすごく歴史というか、面白さがあって。
へえ、確かに動画とか画像と比べてデータ量とかデータの形式がよくわからんもんな。
いい問いですねそれは。とてもいい問い。
やべえまた何か間違ったかな俺。
いやいややってるやってる。すごいいい問いだなと。
いいねって言われると、いい間違い方だねってことか。
いやいやトラウマになってんじゃん。そんな引っ掛けないから油断した時にしか引っ掛けない。今警戒してるもんカネリン、顔見るわかる。
来るかなって警戒してる時には出さない。油断した瞬間に来るからね。
怖いなあ、気抜けないなあ。
でもねカネリンが今言ってくれたのと言ってくれた通りで、画像は何となくわかると。
っていうのは画像ってさ、いわゆるピクセルだよね。デジタル画像ってピクセル単位で粒がいっぱいあってさ、そこの色の組み合わせで画像がになってるでしょ。
それって何となくわかるよね。何ピクセルみたいな。
で一個一個のピクセルには3つの値を持ってて、RGBね。だから色の情報だよね。
255まで。
そう255までの情報を持ってて、その組み合わせで一粒一粒の色が決まってますよと。あとは画素数、ピクセルの数でこの画像ができてる。それはわかるよね。
わかるね。
それってじゃあAIに伝えようと思ったら結構簡単で。だってピクセル1個に対して数字3つだから、それ1個ずつAIに伝えていけばいい。
そうねそうね。普通に順番にね。
3Dデータの基本概念
順番に伝えていけば、画像の情報だなっていうのがわかると。これを応用して3Dデータ伝えればいいんじゃないかっていう概念があるの。
そうやって今思いついたこと言っていい?なんかMRIみたいに輪切りにした感じでやっていけばいいんじゃないの?画像をこうやって。
あ、こう積み上げていってみたいな。
そう、なんかそんなイメージ。
それね近いすごい。
近い?
めちゃくちゃ近い。
やった。
いい発想。もうAIに来てますね。脳がね。AI。もう3回目にして。
AIの気持ちに慣れてるちょっと。
AIに気持ちに慣れてます。
そうそういうね組み方をするのよ。なんだけど結局そういう風にすごく細かくやっていくとデータ量が3次元だから半端ないと。
なんで一旦Voxelっていう概念使いましょうねっていう風になったんですね。
なんか聞いたことあるなVoxelって。
Voxel。だからPixelのボックス版だよね。
うーんそうVoxelっていうんだ。
だからすごいわかりやすくイメージしてもらうならRubik's Cube。
はいはいはい。
あれって9かけ9かけ9でしょ。あれの最初Voxelで立体扱うとなった時には32かける32かける32の立体。わかる?なんとなく。だからRubik's Cubeのもっと細かい版みたいな。
めちゃでかい難易度高そうなRubik's Cube。
そうそう32があったらね相当多いんだけど。そういうので一旦立体扱いましょうっていう風になったのね。それがVoxel。
なるほど。
で32かける32かける32だと結構立体としてはマインクラフトで作ったみたいな。
32っていうことは6かけ6ってことだよね。一辺が6ってこと?
いや一辺が32。
めちゃ長いねそれ。
32かけ32かけ32。
ああそうですか。めちゃめちゃでかいな。
一応ねVoxの数で言ったら32768。32の3乗だから。
へえうんうん。
ただ32ってさ別になんだろう多いけど横並べてみたらそれで立体作ったらさ、そんなに成功な立体じゃないよね。
それこそマインクラフト的な感じになる。
マインクラフト的だよね。
カクカクな感じ?
そう。なんだけどまあやっぱり一旦それでやろうって言って、その32かけ32かけ32の空間で立体を表現しましょうと。
この四角の部分にVoxを置くか置かないかっていう情報を立体として持つと。
だからピクセルの画像で言ったらRGBのところに立体の座標でここにVoxがあるかないか。
あるかないかだけ。
あるかないかだけ。
0か1みたいな。
そう。そうするとさ立体を表せれるのなんとなくわかる数字で。座標とあるかないかで。
座標なんだね。
そう。っていうのでVoxelっていう概念を使ってちょっと3DデータをAIで扱ってみましょうという取り組みが行われたのが2015年。
インプリシット表現の誕生
2015年。
2015年。
10年前?
そう。10年前。ここで初めてVoxnetっていうAIのモデルが作られて。こいつは3Dデータを入れたらそれが何なのかを返してくれるAI。
だから犬の3Dデータ入れたら犬ですみたいな。猫入れたら猫ですっていう風に。
何なのかを分類するようなAIを初めてここで作ったのね。Voxelで。
結構前にあったんだね。そんな。
そう。これは全然生成AIじゃないよ。本当に画像を入れて猫か犬か判断するのと同じ文脈。3Dモデルを入れて猫か犬か判断するみたいな。
そういうものを最初に扱うっていうのが2015年にあったと。ここが3Dデータの始まりなんだけど。
そうやってVoxelで3Dモデルを扱えるようになったら当然3Dモデル入れて判断するのもできるし、言葉を言ってそのVoxelを出すっていうのもできるのね。
なるほど。
学習してるから。
何それ犬を出して。
犬出してって言ったらなんかこう学んだ中からVoxelの組み合わせでこういうのが犬だよねってすごい四角いカクカクした犬が出てくる。
マインクラフトだね。
そうマインクラフトまさにマインクラフトみたいな感じ。これ3Dモデルの生成できんじゃんという風になるわけね。
カクカクだけど。
カクカクだけど。じゃあまああとカクカクだからこれカクカクをどんどん細かくして解像度上げていけばすごい成功なモデルできるんじゃないかなと。
そう思うね。
そう思うじゃん。そう思うんだけど結局増やすとさとんでもないじゃん数が。
データ量が?
データ量が。32×32×32でも3万とかだよ。これいっぺんを1000とかにしてみ?って言ったらもう奥に行っちゃうのね10億とか。
天文学的な数字になってくるじゃん。
そうでも1000でもちょっとさ、別に四角の組み合わせだったらそんな成功かって言われたら局面も表せないし。
1万にしようってなったらもう天文学的数字になっていってしまう。全然表せないねと。
なるほどね。ブロックで表すのが限界があるって感じなのかな。
そう限界がある。
なるほどですね。
だからちょっとデータの持ち方変えようぜと。っていうのが発明されたのが2019年。
なるほどなるほど。
これが2019年にちょっと形じゃない、ちょっと難しい?大丈夫?
どんな表し方すんのかなーって思ってさ、なんかこの点からこの点までのなんかそのこういうカーブで描くみたいな、なんかそういう感じなのかなーとかなんかちょっといろいろ考えてた。
あーもう賢!賢じゃん。今日調子いいね。
賢。
賢ですよ。
やったー。
ハネリン賢ね。
考えてた今ちょっと。
そう、あのね、ボクセルでやってもカーズが多くなると。これもうそういうボクセルで禁止しててもダメだなっていうので、インプリシット表現と。ちょっと難しい。
インプリシット。
インプリシット表現っていう表現が編み出されます。これ何かって言ったら、形を数式で表そうと。
うんうんうん。
さっきカネリン言ったように、ここからここまでの距離とか、そういう数式ベースでちょっと置き換えていこうと。一回もうモデル入ってきます。3Dモデル入ってきますと。
いつも入ってきたら一回ボクセルにそれを禁止して学んでたんだけど、それを数式として持ってそれを学習しましょうと。
なるほどね。
という方式になったのね。
数式ってそのカーブとかを数式で表したりとかそういうことだよね。
精密に言うと、1個じゃあこの点を取って、そっから立体の表面までどのくらいの距離があるかとか、この点が立体の中なのか外なのかみたいな。
そういう情報を1個1個計算していくみたいなやり方なんだけど、すごい分かりやすく例えると、立体のものを立体のまま保持しておくか、立体の設計図を情報として持っておくか。
なるほどね。
紙だったらペラペラじゃん。いくらでも持っておけるんだけど、立体を立体のまま持っておくと、部屋が立体で埋め尽くされるでしょ。
分かりやすいねその例え。
でしょ。定評あるから例え話に。
そうなんだ。なるほどね。
なんとなく分かるでしょ。やっぱ図面とか情報として形持ちたいよね。
そうだね。でもなんか数式で表すっていうのもよくイメージあんまつかんけど、それでもすごい数式の量じゃねえのとか思っちゃうけどね。
そう、やっぱ数式の量ではあるんだけど、Voxelで局面を近似するよりも圧倒的にデータの量は少ないの。局面をやろうと思ったら。
理論上は解像度無限だから。数式だからね。小数点とか使えば。Voxelで近似してないから。計算式だから。
そのカーブ一つをVoxelで表そうとしたらさっきの何億みたいな。
そう、ちっちゃいVoxelをいっぱいいっぱい。もうそのVoxel自体をすごいちっちゃくしないと近似できない。
なるほどね。
それを数式にすることによって、そういうVoxelっていう単位から解き放たれたわけ。
なるほどね。なんか氷をアイスピックで丸めた丸い氷を作るの大変そうだもんな、Voxelで。
そうそうそう。結局すごいちっちゃい四角を組み合わせていかないと。よく見たらカクカクしてるんだけど、近似的には一応丸っぽいよって。
それはつるつるに近づければ近づけようと思うほどVoxelの数とんでもないことになるってことだよね。
そう。
無理ゲーじゃん。
だから理論上もう局面が。
理論上無限に。
そう、できない。
あーなるほどね。だったら設計図じゃないと無理だね。
そう、設計図で理想的なものを数式で表せるようにしてそれを学習しましょうという表現が4年後か、2019年にインプリシット表現っていうのが生まれたと。
4年で無理だこれってなったんだね。
新技術スパーク3Dの提案
無理だこれ、もうVoxelじゃあ限界あるからその表現でいきましょうっていう風になったと。これが一個の進化なのね。
で、そこからインプリシット表現を使ってずっと生成AIでその生成AIの文脈が来たからそのインプリシット表現で学習して生成するということがずっとやられてた。
だけどやっぱりこれも少し問題があると。
今の数式バージョンダメ。
うん。なぜかっていうと結局伝言ゲームなのよ。
伝言ゲーム。
だから形が入ってくるでしょ。学習するときに。で、それをインプリシット表現に落とすと。で、それをAIに学ばせます。
じゃあAIから生成モデル、だから3Dモデルを吐き出させるときはインプリシット表現で出てくると。設計図が出てくる。
だからそれを元に立体を作りますよと。そうすると変換2回入るよね。学習のときも入ってるし、出すときも入る。
この間の話にもあった伝言ゲームか。
そう。
そうかそうか。
結局細かい部分、すごい細かい部分は落ちてる、そこで。
人の顔を見て1回テキストにして、それを読み込ませたらそれは別人になるよねってそういうことだよね。
そう、まさにそう。結局3Dモデルを3Dモデルとして扱えてないから。
そのままね。
そう、そのまま扱えてないから細かい部分が欠損したりとか、なんか違う形になっちゃうよねと。
欠損はするんだね、でもその精密な数式で表しても。
表してもね、やっぱね、欠損する。どうしても落ちちゃうっていう部分もあるし、その学習するときは別にね、その学習したとしても、生成するときは、
やっぱその学習してる脳みその領域から吐き出すから、やっぱ意図しないものが出てきたりするわけ。
学習してるものがそんなに正確じゃないから。
っていうのがあって、なかなか精度は上がっていくんだけど、クオリティが上がりきらないというか、もうちょっとね、入力した画像に対して正確に出てこないかなというところをすごく課題として持ってたわけ。
そこで出てきたのが、スパーク3Dなんですよ。
そこで出てくるんだ。
そこで出てくる。結局、じゃあどうしようと。これ何が問題かって言ったら、結局AIの脳みそにどうやって3Dモデル伝えるかっていうところのパイプラインが問題なのね。
インプリシット表現で落として学んで、出してまた生成するから、一回こう変換しちゃってると。
はいはいはい。
でもVoxelはVoxelで使ったらデータ量多すぎて全然扱えんと。
パンクするもんね。
パンクする。ここの与え方をどうすりゃいいんやっていうところに切り込んだのがスパーク3Dなのよ。
すごいじゃん。もう全然閃かない。もうどうしたらいいのって感じ。
あのね、スパーク3Dの考え方は面白いというか、結局3Dをちゃんと扱おうと思ったらVoxel最強って扱い方。
Voxelでやんなきゃ3Dモデルを3Dモデルとして扱えないよねと。変換しちゃダメだよと。
ダメなんだ。
そう、そういう発想なのね。
またちょっと原点に立ち戻ってくんの?
そう、原点回帰だねこれ。
そのなんか写真の時も結局写真のままこう扱えないとダメだよねみたいな話で。
あ、そうそうそうそう。
マルチモーダルでみたいな話だったよね。
よく覚えてらっしゃる。
なんかさ分かったような気になってんだけどさそこも。結局写真を写真のまま扱うってどういうことなのかなーってちょっとフワッとはしてるけどね。
スパーク3Dの基本概念
そこはね結構難しい。抽象的な考え方というか抽象的ではないんだけど、AIの仕組みをしっかり理解しないとなかなかこう説明しづらい。
まだまだ先の特別講義編ですなそれは。
そう、一個一個ねちょっとトランスフォーマーなんぞとアルゴリズムについて説明していきたいとは思ってるから、ゆくゆく。
ゆくゆくね。
落ち着ける日が来るんで今ちょっとそわそわしてる。なんかわかんねえなつってそわそわしてくれてれば。
それはしょうがないね。
いいそうそう。
うんうんわかりました。はいはい。
でそうでスパーク3Dはボクセルをベースにしてやりたいと。
ボクセルでね。
うんなんだけどそれだとやっぱ現実的じゃないと。から新しくスパーキューブスっていうスパーク3Dが作ったボクセルみたいなやつを生み出したね。
なんかスパークするキューブなんか茂キックスみたいだね。
ごめんなさいねなんか。それをイメージしちゃったんだけど。
茂なんかすごいそっちに引っ張られるかもしれないそれ。いいかも。
スパーク。
そうスパーキューブス。
スパーキューブス。
そうねスパーク。
スパーキューブス。
そうスパーキューブスっていうのを。
キューブス。
結局ボクセルなんだけど。ボクセルとインプリシット表現のいいとこ取りをしようっていう風にやったのね。
へえ。
なんか結局ハイブリッドみたいな形になってる。
へえそうなんだ。ハイブリッドってどういうことって感じだけど。
概念が難しいんだけど、結局ボクセル全部で表そうと思うとめっちゃ量々大きくなると。
うんうん。
実際でもいる形って立体の表面ぐらいですよねと。
なるほどね。中身いらんってこと?
空洞のとこいらないよね。中身もいらないし空洞のところも別にボクセル必要ないじゃんと。
空洞って何?
空洞、中身が立体があって中あるけどさ、中は密だからさどうせ。別にそこの情報いらないじゃん。内か外が分かってればいいから。
外側だけでいいと。
そう。側だけでよくないみたいな。
33元堂の仏像の中身が空洞なのと一緒やね。
分かんないそれ。
ごめん。
ちょっとたまにはマウント取りたくなって。
あんまりね、お寺とか詳しくないよね。
この間たまたまテレビでやってたから見ただけなんだけどね。
あ、そこを使ってきた。
そうそう。なんかその仏像の中身がスカスカだから軽いとかさ。
仏像ってさ、中身あるやつあんの?
分かんない。
充填されてるやつなんか。
普通充填されてないんだ。
ならの大仏とかあれが充填されてたらとんでもないことだなと思って。
そうだね。なんかさ、人の大きさぐらいの仏像だったから。
なんかパッと見重そうだからさ。
地震でも倒れなかったとかって言って何?って言って中身見たら空洞で重心うまく設計されてましたみたいな話出てたから。
これなんか3Dモデリング支部長の出番やんけと思って。
あそこで考えてくれたんだ。
なんかそういう立体的なもの見ると最近支部長の顔が浮かぶよね。
これからどんどんそうなってくるからね。
でもそういうことだね。
でもそういうこと。
表面があればいいって。
表面があればいいよねと。じゃボクセルも結局表面周りだけあれば良くないっていう。
なるほどね。
でそれがスパーク3Dなんだけど、スパークってスパースの略なのね。
スパース。
スパースってソ。
え?
ソニーとか。その密じゃないみたいな。
ああはいはいはい。
そういう意味の単語なんだけど。
ああ。スパークじゃないんだ。
密じゃないよと。そうスパークじゃないのよ。
ああ。シゲキックスはじゃあ間違ってるね。
スパースからそうスパースから取ってるのね単語としては。
スパース。うん。なるほどなるほど。
そういう表面だけにブロック置きましょうねっていう考え方。
うんうんうんうん。
だけど表面にブロック置こうと思ったら結構この情報どうやって扱うのっていうところでそのブロック自体にこれちょっと概念難しいからなんとなくふわっとでいいんだけどブロック自体にインプリシット情報を持たしてるのね。
ブロック自体にインプリシット情報。
ブラックの配置自体にそういう関数の情報というか。
計算式みたいな。
計算式みたいなを持って配置してると。さらにこれ僕もね全然理解できてなくてわかんないんだけどブロックを四角じゃなくてもいいよねっていう発想になってるらしい。
えーじゃあマインクラフトが四角の世界じゃなくなるってこと?
そうだからボックス自体を自由な形にしちゃって表面に貼り付けるみたいな形にしてるのね。
それこそ丸みたいなのありってこと?
局面がねいけるかどうかわからないんだけど角角のボックスボクセルよりもずっと綺麗になるのね結構局面でも局面にフィットできるように角をずらしてるって書いてあった論文には。
だから本当にボクセルで本当に表したいんだけど今までできなかったんだけど結局そのボクセルの数が問題だったと。いっぱい用意しなきゃいけないから。
本当に必要な部分にだけボクセルいっぱい細かく貼り付ければ立体をそのまま立体として扱えるよねと。
っていうのでそのスパーキューブスっていう発想を作ってそういう処理ができるようにしたんだ。
なるほどね。それプラスそのボックスの形も四角だけじゃなくなったってのもそこがハイブリッドってこと?
表面の物体の表面にだけボクセルあればいいよねっていう配置の部分がインプリシットとのなんかハイブリッドな感じになってる。
なんか数式を持ってるって言ってたのか。そういうこと?
でまぁそのブロックの形変えれるっていうのはどこの文脈なのか正直ちょっと論文読んでも理解できなかったんだけど。
なんかブロックの形の部分気になるね。
それをね自由にフィットできるようなそういうものを開発したよっていう。でこれが結構一個のコアなのね。でこれ全然AI関係ないの。
新たなパイプラインの設計
AI関係なさそうだねそれ。
これ普通のアルゴリズムだから普通のっていうか単純なアルゴリズムの話。だからこれ処理するのにAIは別に何も使ってない。
渡し方とかその規格の話だよね。規格って。
そうどういう形で立体を扱いましょうかっていう。スパークキューブっていうのを定義してこれで立体を扱うとボクセルなんだけどすごく厳密に細かく情報を表現できると。
これだと大体ボクセルの数が10億ぐらいあっても全然いいらしい。1240×3畳みたいなぐらいの精密な情報になれる。でも処理できるっていう風に書いてあった。
相当細かく扱うことができるようになりましたっていうスパーキューブスっていうのをまず開発しましたと。
それが今年の5月?
そう。でもう一個あるのよ。スパーキューブス用にスパーキューブスってまだ立体の情報をこういう形に変換しましょうねっていう風にしただけだからこれをAIに伝えなきゃいけないと。
それを伝えるためのそのパイプみたいなのを専用で設計したのね。
ほいほいほいほい。パイプね。
パイプ。そのままだとちょっとAI入らないから。
そのまま渡しても。
そうそのまま渡してもダメだからちゃんとAIのベクトル領域みたいなところに学習で持っていけるようにこのスパーキューブス専用のパイプみたいなのを作ったのね。
それがスパーコンブVAEこれ覚えなくていいんだけど。
コンブ?
コンブ。コンブっていうのは畳み込みニューラルネットワークのことなんだけどこれまたね今度説明するから。
ちょっとざわざわしてきた。
コンブってコンブじゃないよ。コンブっていうと結構画像を最初にAIで処理しようとか学ぼうって思った時に畳み込みニューラルネットワークっていうのが出てくるのね。
畳み込みニューラルネットワーク。
コンボリューションニューラルネットワークって言って。その略がコンブなんだけど。
畳まれた都コンブみたいなのイメージする。
そうなんだよね。俺もねプログラム書いててコンブ2Dとかって打つんだけどすげーねコンブが出てくるのよ。コンブって打つたびに。
食べ物の方がね彷彿させるんだけどそうじゃなくて畳み込みなのね。畳んだコンブじゃなくて。
一旦スルーしとこうかなその辺は。難しそうだな。
そう。でVAEっていうのもねバリアブルオートエンコーダーでこれもまた今度説明する。
これオートエンコーダーっていうそういうモデルがある。とにかく何をしたかっていうとスパーキューブスをAIに、
AIというかその学習モデルの脳みその方に伝えるための変換機器を専用で作ったと。
それがないとダメなんだ。
そう。ネイティブで扱えるように。
そのまま翻訳せずにいけるってことだよね。
こいつがあるからもう直で入るよみたいな。そういうパイプを3Dモデルを扱う形と一緒に作ってあげたっていうのがポイント。
それ専用みたいな感じ。
それ専用。
それはさ、ちょっと話はあれなんだけど。
そのVoxelでそのまま扱いますっていう時もその数式で扱いますっていう時もそういうパイプはあったのかね当然。
そうそういうパイプはあった。
じゃあだいたいセットで開発されるものなんだねそのパイプってのは。
いやパイプはね既存のものを使ってたりする。
ああそうなんだ。
専用で作ってないから。
今回だからそれを専用で作ったってこと?
そう専用で作ったってこと。
ここがやっぱ情報をスパーキューブスの劣化がないままに伝えれて、
でその生成案の脳みそから劣化がないままに出せるからすごい細かい形状が再現できるようになったよっていう。
その専用のパイプ設計っていうのが結構すごいことなの?
そうここがね工夫点。専用のこういうふうに3Dモデル扱ったらいいよねっていうルールを作ってそれ用のパイプを設計してあげた。
3Dモデル生成の進化
だからっていうだけなのスパー3Dって。
なるほどなるほど。
そうだから結局じゃあ脳みそ生成する部分の脳みそって別に新しく開発してなくてもともとあったもの。
なるほどね。AIはそのまま。
AI自体はもともとあったものを使っていて、そこのパイプラインを新しく革新的なものを設計しましたっていうのがスパーク3Dのコア。
なるほどね。そういうところでこう革新が起きるんだね。
そうそこがね革新が起きてる。でもうみんなさすごい3Dモデルがバーって出てくるようになったから、
生成AIがめちゃくちゃ進化したんだって思ってるんだけど、そこの脳みそじゃなくて実はそのパイプラインがめちゃくちゃ進化したからすごい良いものができるようになったっていう、
そういう驚き方をしてほしいなっていう話なの。
よくわかりましたよ。
わかった?なんか僕が最初に言ったことを。
驚くポイントそっちじゃなくてその手前のここだよっていうね。
そう3DモデルをどうやってAIに学ばせたいとかどうやってAIから取り出すかっていうところのパイプがネックだったんだよっていう。
へえ。
そう意外とさだって生成AIのサービスで3Dモデルがこんな形でボンボン出てくるようになりましたって言ったらやっぱ生成AIが進化したんだって感じるじゃん。
そうだよ。感じるしそうやって言わないとわかんないよね。
わかんないでしょ。
パイプライン何?っていう話から。
そうその伝える部分なんだよねっていう。
よくわかんないもんね。
でもやっぱそういうとこがね大事。なんか脳みそがどんどん進化していってとんでもない賢い脳みそができてるんだっていう風にAIの進化を捉えちゃうとやっぱちょっとその解像度って悪いよね。
確かに。なんかブラックボックス化してるからさやっぱりさ。
そうそうそう。
僕らからするとさ、生成AIっていう魔法みたいなとこに突っ込んだらすげーの来たみたいなさ。
そうそうそう。
そういう流度なんですよ。僕らみたいなのはね。リスナーさんはもうちょっと賢い人もおると思うけど。
だからそういう意味ではなんか今初めてそういう視点をもらった気がしたな今日。
3Dモデルの技術的進化
そうなんだよね。だからさもう本当に人間を超えた脳みそがどんどんできてるんだっていうとこじゃない部分が割と進化してたりもするから。
なるほどな。
だから驚き方としてはそういう僕が今日言ったようなパイプラインの部分がこう進化して3DモデルっていうのをもともとVoxelで扱ってたのをインプリシット表現っていう数式に置き換えたけど、やっぱVoxelに戻した。
それをもうちょっと扱いやすくしたんだっていう工夫があってこれなんだっていう驚き。落ち着いて驚いてほしいと。
それはなんかその経緯わかってすごいなるほどなって思ったね。
面白いでしょ。これね僕特に3D生成はやっぱね自分の本業とか趣味に関わる部分だからめちゃくちゃ面白いなと思って。なんでできるん?って思うじゃん。
それさ、でもちょっと引っかかって気になってるのがそのなんかブロックの形がなんかいろいろ変えれますっていうところと。
あと中身空洞でもええやんけっていうのはさ、中身空洞で出てきてどうするのそれ?中身冷たい場合はどうすればいいの?
どうせ中身はね表と裏で情報が分かれてるから裏は密になるわけ。
うーん裏って何?
裏ってその内側。
内側?中側?
そういうものがあったその内側って内側と判断されたところは密になる。
ああそうなんだ。
てかもともとねその3Dモデルこれ絵は全然関係ないんだけど。3Dモデルっていうのはそういう扱い方をするのよ。
なるほど。内側が密になる。
そうあのね基本的にはメッシュモデルっていうさ三角形の組み合わせみたいなポリゴンあるじゃんポリゴンザポリゴンみたいな。
ポリゴンね。
結局三角形がすごいちっちゃくなったのが近似的に組み合わさってまあゲームとかのさCGができてるんだけどあれも表面しかないのよ情報。
表と裏側があって裏側は裏側って判断されたらそこにこのが密になるみたいな。
うーん。
そこのものがある空間だよねみたいな。
だったらもともとそこにねあれだねブロック定義する意味ないね本当にね。
そうブロック定義する意味がもともとなかった。
うんうん。
でもやっぱ学習をしようと思った時にその表裏っていうのをちゃんとこうボクセルの中だけで判断させようと思うと結構難しいよね。
なるほどね。
だからあるとこはもうボックスで置き換えると。
うん。
っていうのをやってた。っていうのを賢くできるようになったっていうのがポイントやね。
なるほどな。たぶん理解できたと思うよ。
僕もね結構頑張って読んだのよ。結構難しくてこれ。
そうなんだ。支部長でもこう難しいんだ。何を読んでんの?論文みたいな。
スパーク3Dの論文があるからそれちょっと概要欄にハットを置いてもらおうかな。
ね。見たい人はぜひ。
そうまあ図を見るとねなんとなくわかるよ。
うーん。そういう絵がついてんだちゃんと。
ああなんかボクセルがこう曲がってるみたいな。
へえ。
ギュッとなってるみたいな。全部英語なんだけど。なんかそれ見るとこれ言ってたことこれかなみたいなのがわかるから。
まあ図だけ見るのもねたぶんいいと思う。
ああなるほどなるほど。
っていうことでそんな感じでね3Dモデルが今進化してると。
了解。ちょっとなんか質問していい?
いいよ。
あのさ、この進化はじゃあ次どこがどう進化してどれぐらいいくのかねこれね。
っていうのはさ、俺さ今回やってみたのよ。写真ぶち込んでさ、なんか自分の顔写真みたいなのとか。
なんか結構やばいことになる。ゾンビみたいな顔になるんだよ。
元々俺がゾンビみたいな顔してんのかもしんないけどさ。
でも違う人の顔入れてさやってみてもさ、なんか顔崩壊するんだよね。
ああ顔崩壊。
それ今そういう感じなの?人の顔はちょっと無理みたいな感じ?
いやそんなことないよ。できるできる。
なんで?
多分その三面図で入れれば、三面図とか四面図で入れてけば結構いい感じでできるとは思う。
今一枚絵で入れて正面から顔写ってるやつをバンってやっても顔がゾンビになるんだよ。
ゾンビ?
具体的にはなんか目がもうないみたいなのとか。
ああはいはいはい。
顔なんかも溶けて貼り付きましたよみたいな感じで、目がもう目玉取れてゾンビみたいな感じになってる。
ああそうなってる。
これマジ怖いなと思って。それはなんか僕の使い方がおかしいのか、人はまだ難しいっていうことなのか、なんなんだろう。
いや人はね難しいことはないと思う。なんか自分のフィギュア作ってる人いっぱいいるし。
じゃあなんなんだろう。
なんかカネリンによく似たゾンビがいっぱい学習されてるのかもしれない。
ほんと顔やばいよ。
ちょっと後で見せてそれ。
そううん。今ちょっと見せようかこれ。
ああ見せて。
例えばこんな。これはグラサンをかけてるんだけどさ。
うんうん。
なんかさ。
ああでもそれなりに。
ゾンビじゃないこの。
色はね確か。ああまあまあまあまあ。いやでもすごくしっかりできてる方よ。
こんなもんなんだ。
こんなもんこんなもん。
なんかおててもなんかぼよぼよに膨らんじゃってる。
ちょっと手がでかいね。
ぼよぼよになっちゃって。
これでも右左って入れればより寄ってくるとは思う。でもほとんどはたんないじゃん。
こういう角度。
一応人じゃん。
まあ人だけどねなんかちょっとゾンビっぽいなと思ってさ。
僕はあれなのよ。かなり前からかなり前って言っても3年2年ちょっと前ぐらいからローカルのPCでできるやつがあってさ。やってたんだけどもう本当に概念みたいなのしかできなくて。
へえなるほどね。もうこんなん全然出なかったって。
全然出なかった。なんか雲みたいなさ。空に浮いてる雲みたいな。何入れてもなんか抽象的なさ。現代アートみたいなやつしか出てこないな。
なるほどね。
そこからしたらもうすごいこれは。
なるほどなるほど。なんか何も知らない僕からするとこんなもんなんねっていうのが正直なところではあったかな。
ああそれはねちょっとハードルが上がっとるね。
でもさなんか渋長のさツイッター見たけどあの渋長キャラの3Dのやつとかはちゃんとできてたじゃん。そういうキャラクター。
あれ3面入れてるからね。
なるほどね。
4面入れてるから背中まで。
リアルの人間の顔とかじゃないのほうがいいのかなとかちょっと思ったけど。
キャラクターのほうがねいいかもしれない。リアルな人間だとどうしてもさ似てる似てないが。
そうだよね。
結構シビアに見ちゃうから。
2次元キャラを3D化するとかだったら。
そうそう。
結構クオリティ高いのみんないっぱい投稿してたもんね。
すごくねそのほうがいいと思う。なんかやりやすいというか。
それさナノバナナでさ赤ちゃんのフィギュア3面作ってさ。
うん。
これこの3D入れてる人とかってうまく出てきてんのかなちゃんと。赤ちゃんの顔他にゾンビになったりしてないかな。
出てきてると思うし。でも基本的にみんな多色成型やらないのね。
淡色で出すから顔どういう感じでもなんか雰囲気みたいな。
そうかそうか色つかないモードもあったねなんか。
そう結局3Dプリンターで印刷すると淡色が多いのよ。
それで見たら確かに。
あんまりねそうなんか形できてて嬉しいなみたいな。
そういうことかね。
そうだからねちょっと今日言いたかったのが結構驚くんだけどこれすごい。
言うほど何かに使えるかって言われたら何何かそんなに使えないっていうのは確かにある。
フィギュア、現実世界で何かものづくりしようと思ったらフィギュア作って終わりだし。
でも3D、CGとか扱ってる人は多分すごいやりやすいと思う。
CGグラフィックを使ってゲーム作ってる人とかはこういうのを作れるとすごくいいんだろうけど。
実際に使えるんだ。
そう実際に使えるのかなちょっと僕もねあんまりそのCGの分野は詳しくないからわからないけど。
なるほどね。
ちょっと驚き間違ってる人はこれがあったらもうこのものづくりとか全部設計とかもうどんどんAIができるようになってくるよみたいな。
っていう人はいるんだけどそこまで全然当然ならない。機械作れるかとは全然別の話なんで。
とりあえず形を作れるようになったねみたいな。
なるほどね。この先はでも末恐ろしいわけだよねでもさ。
もっともっととんでもない進化してくのこの領域も。
してくと思うけどどうなんだろうね。そこがねちょっとどうなるんだろうっていうのがあって。
例えばクオリティを突き詰めていっても結局できることそんな変わらないじゃん。
フィギュア作ったりとか3DのCGができるよねっていう部分。あとはちょっと生成が早くなるよねとか。
そこってあんまり確信的じゃないよねって思ってて。
どういう方向でよりこの3D生成が使えるようになるんだろうっていうのは読めない正直。
なんか何がよりさもうめちゃくちゃリアルな立体ができますよってなってもそれどうしようってならん。
それはやっぱメタバースっていうかゲームとかで使えるよねみたいな話にしかならないっていう意味今言ってんのって。
使い所だよね。
どういう使い所あるかなと思って。
僕みたいに3Dプリンターで印刷して楽しいってなるけど楽しいで終わっちゃうからさ。
確かに。
結構まだ発展途上実験的っていうのが結構大きいかなとは思うね。
でもなんか今回はこういう3Dのさ領域の話だったけどさ。
まあいろんな領域があるじゃん動画とか静止画とか言語もだし音声とか。
やっぱ一般の人が目に見えて驚けるようになる水準まで来たってのはなんか1個のライン超えたっていう感じではあるのかね。
そうだね。あとは3Dモデルの民主化みたいなものが起きやすいのかなっていうのは一つあって。
今までって3Dモデルって専門の人しか扱えなかった3Dの形状のデータって。
それを生成できるようになるとその3Dモデルの民主化が起こりますよと。
メタバースとかそういう文脈でよりこうそういうものが生活に入り込んできたりする世界が来るかもしれないし。
それこそ3Dプリンターの文脈で3Dものづくりをする人がどんどん増えるかもしれないし。
っていう話がねあるから。そのまるまるの民主化っていう文脈だと3Dモデルの民主化がAIによって進むのかなっていうのは1個あるね。
なるほどね。これを使ってまた別の産業というかなんかができていくんでしょうねって感じかな。
実際の利用と問題点
そうだね。だからまあやっぱねAIが作った3Dモデルを立体化するみたいな技術に前もって触れておくっていうのはすごく大事で。
そのためには必要になるツールがあって。それが。
うわ。悪い顔してるぞ。何でしょう。
3Dプリンターっていうすごい機械があるんですよね。
そうね。
今、だいたいどの家庭にも1台はあるのよ。
電子エンジン洗濯機3Dプリンターって3種類人気というかあって当たり前のもんだからあるんだけど。
うちだと7台くらいあるんだけど3Dプリンター。持ってる人はそのくらい持ってるけど。
7台?
だいたい7台あるね。
今スルーしちゃったんだけど。そんなに使い分けるもんなの?
いくらあってもいいからね。別にお金と一緒やね。別にあって困ることないからね。
いくらあってもいいものなんだ。3Dプリンターって。
今だって足元に1台で背中に1台で他の部屋に1台。しかも今まさにハイテム3Dで作った渋長フィギュアをカラーで印刷してるのよ。
へえ。
他の部屋で。
すごい。
マルチカラー印刷っていうね。俺はカラーでやってる。
面白え。
樹脂を使い分けて。
作ったらやっぱアウトプットしたくなるよねそりゃ。
なる。でも24時間くらいかかる印刷に。
ああそうなんだ。大きくそんなでかくないでしょでも。
そんなでかくないけど。やっぱ色をね色々使わなきゃいけないから時間かかるよ。
いやちょっと1回買おうと思って色々調べましたからね。
そうでしょ。
なんかうーん。
なんで買わないの。
3Dプリンターとモデルの民主化
いや俺あんまり印刷したいものないもんなと思ってさ。
それはねあれよ。ちょっと考え方が違うかな。印刷したいものがあるから3Dプリンター買うんじゃなくて、
3Dプリンターがあるから印刷したくなるっていう順番がちょっと違うかな。
ああそれは確かにわかるけどね。
肥やしにしてる人も多いけどね。買ってみたけどって。
ああそうですか。
実際ね。そう。
それはなんでなんだろうね。そんな印刷したいものねえよみたいな。
飽きちゃうんだろうね。
渋谷はなんで飽きないの。何を印刷してんのいつも。フィギュアとかばっかり印刷してるわけじゃないでしょ。
僕はね機械の知識があるからギミックを設計できるのよ。歯車とか。
そうすると別に動かせるもの作れるから、ぶっちゃけ何でも作れるっていうのはある。
そっかそっか。だから市部長みたいなそういう人はそれは面白いかもしれんけど。
一般人がさ、一通り考えられるフィギュアを印刷して、お庭のプランターの鉢をちょっと印刷してぐらいしか僕は思いつかないわけ。
それ印刷したら多分用済みだなみたいな。
そうなるんだけど。
あと何だろうペーパーナイフぐらいは。
ああそうそうそう。
それぐらい。
でも3Dモデルを共有するサイトもある。
ああそれ聞いたよ。
そう。
見たよ。なんかいろいろあるなと思って。
ある。だから他の人はどっかの誰かが考えた形がすぐ自分の手元で再現できると。
これだと思って。これ拳銃作ったら捕まるやつだと思って。
発想はねやっぱもともとその警察の発想よね。
これかみたいなねそのデータを。
そうデータでもう形状を扱えるようになる。ちょっと近いよね今日の話と。
データで形状を扱えるようになって、それを印刷できるようになったから、ある意味その3Dデータの民主化っていうのが結構進んだのよ3Dプリンターで。
AI技術の理解
形をデータとして扱うっていう文化が3Dプリンターのおかげで生まれたっていうのはあるね。
なるほどね。それがなかったらないよねって。
そう別にないし、別にじゃあ3Dモデルをもらったところでみたいな。これどうすんのみたいな感じになるけどそれ印刷して手元に再現できるっていう。
まあいつもねもう物作りの話になっちゃったけど。
それは確かにねやっぱ面白そうだよね。
だからそれアウトプットするものがないからさ、3Dって言ってちょっと見てはいはいすごいねで終わるけど、これうちにそのアウトプットするプリンターあったらさ、ちょっとこんな作ってみようかしらってガチャガチャ触りだしたりするんだろうね。
すると思う。しかもねそれが今はあくまでもAIだとフィギュアとかそういう形しか作れないけど、
今後ねもしかしたらキャドモデルとかその機械の部品が作れるように、すでにあるけど若干そういうサービスも歯車作れたりとか、そういうのがどんどん進んでいくとギミックもね生成で作れるっていう時代が来るやもしれないと。
そしたら面白いじゃん。
物作りの民主化だねそれね。
ああそうそうまさに物作りの民主化っていう文脈もあると。
なるほどな。なんかそういう次に来そうなそういう時代感はやっぱり持ってないと感じることはできないだろうな。
そう。
って思って落ちる寸前まで行ったんだけど、うーんって思ってちょっとやめたのはなんかちょっと管理めんどくさそうだなっていうのもあるんだよね。
なんていうのあの素材のやつ?なんかあんまり使わないと放っとくとなんか乾燥してなんか変な風になっちゃうみたいな。
そうそうそうそう漆器ちゃうっていうのはあるけどおせんべいと一緒やね別にね乾燥剤入れてこう落としとけば。
おせんべいと一緒って言われちゃうと。
おせんべいと一緒だよだいたいあんなのおせんべいだから。
そうかすげえなやっぱりすげえななんていうのそのメタファーでいいんでしょうかね例え話がすごいな。
最悪漆器って言ってもいけっから。
そっか。
でおせんべい食べれるでしょ漆器でもなんかちょっとなんかクシってなるなみたいな濡れせんべいだと思って食べりゃいいんだって。
確かにそうだね。
ちょっと無理やり3Dプリンター買わせすぎててねいろんな人にあれだけど。
あのねまあ持っておくと持てる視点もあるしその3D生成に対してもちょっとモチベーションが一個変わるよね形作れるってなると。
いやそれ本当に別に3Dプリンターを売ること俺はなんか助長するわけじゃないんだけど3万円とかでね買えるんだよねあれ。
そう今ね3万円で買える。
3万円で買えるんだったらそれで得られる視点があるならありだよなとは思う。
そうありでしょだからねもうだから実質ただなって僕は言ってんの。
うん。
それで物作るっていう環境が手に入るんだったらもう3万円だよだって。
確かに。
僕が3Dプリンター欲しくて欲しくてたまらなかった10年前とかって。
うん。
だってもう運10万円だったから買えなかったのよ。
そうだよね。
そうそうそう3万って。
知らぬ間に安くなってた。
そう知らぬ間にめちゃくちゃ安くなってこんなね時代になってるから。
びっくりしたのよ。
でしょ。
うん。
という中最後全然AIの話から3Dプリンター好きな話全然しちゃったけどさ。
いやまあ今日はそういう回だよねこんな3Dのやつさ。
そうだよ。
今日AIの話してないからね。
そうなんだよ実質今日はAIの話じゃなくてその前のパイプラインの話して3Dプリンターの話して終わった。
でもなんかさそういう今回みたいな解像度を持つのすごい大事だと思ったよ。
でしょ。
AIすごいしかなかったわけじゃん。
そう何がすごいのかまさかAIじゃないとかすごいと思わないじゃん。
うんまさかAIですらなかったっていうのはさびっくりだよね。
コアがね全然そのデータの扱い方っていう部分だったよっていうのはあるし、
まあそのナノバナから言ってるけどやっぱ変換するとね失われるものあるしっていうのでどういうふうに学ばせるかとか結構重要なのよね。
なんかさブラックボックスの中がさブラックボックスが4個ぐらいに仕切られた感じになってきた。
だんだんこうブラックボックスの中でも領域12みたいな。
そうそうそうまだブラックなんだけどこのAIの脳みその部分とその手前の部分とこのパイプの部分とっていうなんかこのちょっとブロックが分かれた感覚になったね。
ああすごく良いです。もうAIっていうまあAIってブラックボックスなんだけどちゃんと見ていけばその脳みその部分とか勝利の部分って別に見えるとはあるの。
中のパラメーター見えないけどどうやって学習してるの。仕組みは別に普通に公開されてっから。
そこをなんかざっくりでも理解するとなんかなんだろうその過度な期待感も持たないし。
そうだねそうだね。
過度ななんかその失望もしないし。やっぱ落ち着いてAIを理解できるんじゃないかなと思います。
物作りの楽しさ
そうだね。これさ解像度高めていくとさ人の喋ってることがこの人なんか全部ブラックボックスで喋ってんなーなのか。
どのくらいの知識で喋ってんのかなっての分かるようになってくるんじゃないのこれリスナーさんとか。
分かるようになると思う。
怖いねそれね怖いね。
別にねそのAIってその仕組み使わなくてもどっちかっていうとそのノウハウ的な使い方で、そういうノウハウもすごく大事だし。
開発者ですら何ができるか分かってないってのは部分ある正直。
おー。
AIの。
なるほどね。
まさかこんなことができるとはって。
そうか開発する人と使う人との発想がリンクしてるわけじゃないからね。
そうそうそう。だから作り手が一番AIを理解してるかって言ったらそういうものでもないような世界ではあるから。
でもやっぱねこう使う側としてはねやっぱある程度理解してた方がいいかなと思うよね。
すごくいい。
というとこではい。あ、ありがとう。もう1時間ぐらい喋ってるな。
すごくよかった。いやほんとにね1時間超えてる。
かなり時間気にしなくていいって言われてるからね。うまいことうまいことして。
いやいい。終わった時に終わっただよね。今日も喋り尽くした?
うん。言いたいことはねだいたい言いました。
いやお伝え損ねたことはない?
いやもうちょっと3Dプリンター、カネリンがね今日Amazonでポチるぐらいまでいけたらよかったなと思ったけど。
そこまではちょっといけなさそうだったから。
そうだね。
今ポチったよつって。じゃあ今日はこれでみたいな。
でもなんかさそのうちポチるんだろうなとは思うよね。
僕とつるんでたらね不可避ですよ。
何なんだろうな。
送りつけられてくるかもしれない。
送りつけられたらまあ使えますよね。やっぱりイメージがまだちょっとあんまりできてないのかな。
物を作るっていうことはさ。縁のない人生だったからさ。
まあでも作るっていう視点が一個増えるだけでなんかこれ作れんじゃんとか。あれ作れんじゃんってなるから。
ぜひぜひとか。
ちょっと興味あるんでそのうち買いそうだね。
ね。時間の問題というところで。
その時はこのなんだっけ今日のなんとか3D。
うん。
ハイテム3D。
ハイテム3D。
課金してやりますよ。
これさこのハイテム3Dの話ちょっとあんまりしなかったけどさ。
うん。
このなんかモードがいっぱいあるじゃない。
うん。
なんとかプロっていうのはなんかその商業用って書いてあるけどさ。
うん。
これ何が違うのこれにやるとこのもっと何精密になるってこと?
ああそのあれだよね課金システムの話よね。
課金システムっていうかその解像度っていう項目になんかさ。
ああそうそうそうそうより細かくなる。
よりなめらかになる。
よりなめらかになる。けど生成に時間かかるよとか。
うーん。
そのクレジットすごいいっぱいかかっちゃうよみたいなところはあるんだけど。
なるほどね。これ何ヘビーユースしてんの支部長?
そんなヘビーにはしてない。
じゃあまだものづくりのやつにそんな生かしてるわけじゃないんだ別に。
ほとんど生かしてはないけど去年強かったのがトリポAIっていうサービスなんだけど。
はい。
それで自分のブログのキャラクターのフィギュア作って去年売ってた。
へえ。そんな売れるレベルのもの売ってるんだ。
ボットキャストのイベントでちょっと物販したそれで。
支部長君?
いやあのねメカトロザウルス君っていうさ恐竜ロボットみたいなやつがいるのよブログのキャラクターで。
うんうんうんうん。
あれをね去年3D生成して印刷して売ってた。名刺代わりにこう配るみたいな。
なるほどね。
そういう活用はしてたね。意外とね最近いろいろ出てきて、今日ハイテム3Dの話しかしてないけど、それ以外にもねいろいろと出てきてるのよ最近。
なるほどね。
うん。
一旦ハイテム3Dを押さえときゃ今とかOKよってこと?
そう。
はい、落ち着いた。
落ち着きました。他はね結構ブラックボックスの。
うん。なんかこれ以上ねあれ3Dのものいろいろ言われても困っちゃうもんね。
そうね。今からこれ話し出すとあと4本ぐらい撮れちゃうけど。
落ち着かなくなっちゃうよ。
落ち着かなくなっちゃうんでね。まあでも一番ハイテム3Dがちゃんとこう論文公開してて、アルゴリズムあるからこれが一番しゃべりやすいかなと思って。
話題にもなってるし。
なるほどね。あんまり公開されてないんだね。
そう。他のやつはもう完全にブラックボックス。
じゃあ珍しいんだ。そういうなんか論文とか出て。
結構珍しいタイプこれは。だから取り扱わせていただきました。
はいよ。
はーい。じゃあということでね、今日はそろそろおしまいでございます。
おお。
落ち着きましたね。
疲れたねなんかね。
でしょ。
新しいこと。
あと一歩取るで。あと一歩取るで。
あと一歩。
このあとは二本取りだ今日は。
もう一歩取るんだって。
もう一歩取るで。
死んじゃうよ。
もう一回落ち着いてもらわないと。
そうね。
はい。カネリの脳が爆発するまでちょっとやるんで今日は。
はい。ということでじゃあね、そろそろおしまいでございます。ということで次回またお会いしましょう。
番組公式ハッシュタグはシャープ落ち着きAI、ひらがなで落ち着きアルファベットでAIで落ち着きAIです。
番組のご感想はぜひXなどSNSで書き込んでもらえるととっても嬉しいです。
Xであればね、ハッシュタグで検索して全部読ませていただきます。
今回の話良かったな落ち着いたなという人は☆5レビューをつけて応援してください。
それではまた一週間落ち着いて過ごしていきましょう。
さよなら。
さよなら。
01:07:12

コメント

スクロール