リカログのVer2
リカログのVer2の配信を開始します。
そうなんですか?
わぁ、どんどんパフパフってことで。
なんか、気づいたら5周年経ってたらしいですよ。
はい、らしいですね。いつの間にかという感じですけど。
Ver2にするって決めてから5周年経ってることに気づくって、逆だろうって感じではあるんですけど。
まあ、いろいろ、そろそろ今のリカログの状態に飽きてきたところなので、刷新しようってことがあって。
冒頭に言ってた挨拶とかちょっとカットしたりとか、あとはBGM差し替えたりとか、アイコン変えたりとか、いろいろやってみましたっていうところですね。
で、主な目的としては、私たちの作業コースをもっとなるべく減らすっていうところと、
もっと今までやってきた感じからして、私たちのこのPodcastの雰囲気に合ったBGMとか、アイコンに変えていきたいなっていうところで、
Ver2にやった感じですかね。
そうですね。
まあ、ここら辺はちょっとAIさんの力を借りていろいろいじりましたというところですね。
そうですね。アイコンとかはStable Diffusionで、今回使ったモデルはReal Vision Ver2を使って作ってますし、
音楽の方は以前このPodcastでも紹介したSoundrowという音楽を作るAIのサイトで作らせてもらったっていう感じですかね。
そうですね。まあ、この背景作るのも結構頑張ってたら頑張れましたけど。
そうなんですよね。
フワッとだいたいこんな雰囲気でいいなーまで作るのは早いんですけど、そこからこれっていうところで最後作り込むところですごく苦戦するんですよね。
ですね。そこはStable Diffusionの限界というか、というところだと思いますけど。
そうですね。音楽の方もね、多分そういう意味だと完璧に今回はしてないが正しいですよね。微調整できる限界だったんで、これくらいでいいかとして落としどころを作った感じなんで。
そうですね。はい。
まあまあでもやってみて思いますけど、AI生成なんでバッといろんな候補が出てきて、じゃあこういう雰囲気がいいかっていう話ができるっていうのはとても良い体験だったかなというところですね。
そうですね。これをやってみて思うのはやっぱりプロってすげえからプロに発注するって価値あるなって思ったくらいですかね。
それはそう。人間にお願いするのが一番品質と角度が高いです。
こんなのって言ってインプットにするのはいいんだけど、これ以上は厳しいですね。
ですね。はい。
今回イメージにしたコンセプトがどっちかというとテクノロジー関係を扱っているそのバーみたいな雰囲気ですかね。
そこでゆったりとポッドキャストで配信しているようなものが横で流れているのを流し引きするようなそんなイメージで背景画像もBGMも揃えたって感じですね。
そうですね。確かにそういう意味で言うとアバターがサイバーパンクカフェに対しては合ってないですね。
そうですね。なのでちょっとアバターもアップデートしていこうかなと思うんですけど、
そういうサイバーパンク感とかスチームパンク感みたいなものってあんまりオープンにモデル化されていないので、
生成AIがもうちょっといろいろ頑張って賢くなって、モデル用の服とかそういったのもどんどん作れるような世界になってくれるといいなと思いつつって感じですかね。
そうですね。3Dは3Dでなかなか、AIにポリ割りやらせるのは大変そうな気がしますけど、できると嬉しいですね。
あとは思い切って、バーってある意味別世界空間を作ることを価値として提供している商業空間ではあるんで、
割と一般人が迷い込んできましたよう感のあるアバターでも、いいっちゃいいのかなって気もせんこともないです。
そうですね。そういう意味で言えば。
せめて手につけているアクセサリーくらいは近未来的なものがあってもいいかもしれないですけど。
まあ確かにね。ジンベエとパーカーですからね。
その辺のモデルは今後のアップデート課題として、今年度中くらいに良くなっていければいいなって感じですかね。
そうですね。
YouTubeとか他の配信サイトでの更新というのも適宜行っていく予定で、今のところPodcast配信サイトには反映されるはずですけれども、
YouTubeとか独自に画像設定してたりするようなところではまだ反映がしきれないと思うので、おいおいっていう感じになっていくと思います。
はい、そんな感じでよろしくお願いします。
お願いします。では本編の方行きたいと思います。
マイクロソフトのジェネレーティブAI
1点目、マイクロソフト生成AIの事業、拠点を日本国内へ切り替えへということでNHKのニュースです。
マイクロソフトは自動で文章などを作る生成AIの事業で、データセンターの拠点をすべて日本国内に切り替え、情報管理の強化を進める方針を明らかにしました。
マイクロソフトは企業向けなどの生成AIの事業を手掛けていて、AIの機能を担うデータセンターの拠点はアメリカと欧州に置かれていました。
発表によりますと、会社は東日本にあるデータセンターを拡充し、AIの機能を新たに日本国内に置くということです。
生成AIをめぐっては、データセンターの拠点が海外にあることで、機密性や重要性の高い情報管理に対する懸念が指摘されています。
会社は生成AIの事業ですべてのデータのやり取りを日本国内で行うことで、情報管理の強化につながるとしています。
また、生成AIの事業の拡大に合わせて、今後西日本にあるデータセンターの拡充も検討していくとしています。
生成AIの情報管理にめぐっては、NECも日本国内にあるデータセンターを使ったサービスを今月から始めるなど、強化に向けた動きが相次いでいます。
ということで、このPodcastではずっとマイクロソフトがAI関係で一挙になりつつあるよって話をしてきましたが、
それのインフラ基盤として日本国内が注目されているという、日本にとっては吉報ですかね、というところです。
これの一番になっている背景としては、規制の強さが影響しています。
日本とアメリカは比較的AIに関する規制が緩い、言ってしまえば規制が遅れているという現状なんですけれども、
欧州とかは非常に厳しい規制がかかっている中で、生成AIの事業の加速性とかビジネス性の注目度という意味では、
日本の方が欧州よりも高まっているというのが現実なのかなというところです。
政府としてもかなり積極的な採用を目指していて、デジタル庁との連携とかそういった話もあるので、
マイクロソフトとしては日本にこういうデータセンターを置いてよいだろうという判断があったんじゃないかなと思います。
SNSとかでもですね、この日本リージョン、マイクロソフトAzureの日本リージョンでこういったAIのことができるようになったというニュースが飛び交ったり、
プレスリリースが先週ようやく出たりとか、そんな形で日本の力の入れっぷりがすごくなるんじゃなかろうかというような話題も沸騰しています。
マイクロソフトAzureなんですけれども、最新のGPT-4を使おうと思うと、今は申請が必要でウェイティングリスト待ちになる状態ですと。
これも日本リージョンであれば、日本の企業は先行してウェイティングリストの上位に来やすいというような状況もあるようなので、
その辺で今日本がこのSAI事業に飛びつくと、さらにマイクロソフトといいタイアップができそうという背景とかもあるという感じですかね。
これ確認ですけど、マイクロソフトがSAIの拠点を日本だけにしたというわけではなくて、日本にも作ったという話ですよね。
その結果、マイクロソフトのシステムを使う人、Azureシステムを使う人が日本のサーバーでSAI関係のことがやることができるようになったので、喜ばしいという話ですね。
そうですね、その通りですねって話で。
前LINEもありましたけど、海外サーバーにで個人情報を置くのはどうたらこうたらみたいな話とかも前からあった話なので、
日本の法律に合わせたっていうのもありますし、日本が政府レベルでSAIに関与だというところもあって、マイクロソフトがこういう判断をしてくれたっていうのは、
AIを使うサービスを開発する側の今後として非常に良いくのかなというところですね。
そういうデータを海外に置かないといけないから、成立しないからやめちゃうみたいなことがなくなるので、というところで非常に良いと。
日本国内でのデータセンター拡充
法律の話をもう少し踏み込んでしゃべると、データの輸出管理規制がどういうふうに解釈されるかというところですと。
日本の中で作ったデータを海外のデータセンターに置きますという行為が輸出に当たるのかどうかですよね。
現状は輸出には当たりません。
どういう時に輸出になるかというと、日本居住者の人が作ったデータが日本以外の居住者の人の手に触れる、アクセスできる状態になるが輸出になります。
なので日本国内の同僚とかであっても、居住地が日本でない人に渡すのであればそれは輸出になるという考え方になります。
輸出があるのであればそのソフトウェア、データに関しては外溜め法に従って問題ないものかどうかのチェックとかが必要になりますと。
もう一つ意外と落としがちなところで言うと、そのデータへアクセスできる人が誰ですかっていうような立草を作って、そこへのアクセス権限をつけてくださいねって相手の会社に送る場合ですね。
Microsoft Azure の場合はそうじゃないんですけど、一般的なデータ置き場を提供しているサービス会社とかの場合、あるデータを置いてそのデータにこの人たちアクセスしてくださいっていう社員メールリストみたいなのを送るっていうケースもあると思うんですが、
その場合はその社員メールリスト自体が輸出に当たりますということがあるので、その辺の運用とかは自社の法務部とかにちゃんと確認して進めたほうがいいポイントですね。
途中おっしゃられていた個人情報についてなんですけれども、ここはさらに別の考え方が必要で、GDPR 等々の今ある個人情報保護法関係はデータセンターがどこにあるかで変わってくるというところがあります。
なのでそのデータセンターがアメリカとかにあって、そこに個人情報が置かれている場合は GDPR 法とかそういったものを守らないといけないですし、監査対象として法的機関がチェックしに来る可能性があるというところがあります。
アメリカの場合はクラウド法という割と前にできた法律があって、いざ警察とかが取り締まるときにはそのデータにアクセスする可能性がありますよみたいな法律もあるんですけど、その法律についてはあまりクラウド事業者的には気にしなくてよいといったような見解も出ているので、そこについてはそんなのがあるんだくらいでいいのかなと思うんですけど、
いろいろやっぱり輸出管理に当たるのか、個人情報に該当するのか、実際どんなデータが相手の企業に渡るのかといったようなところはしっかり管理しておく必要があるのかなというところですかね。
はい、まあそこら辺は会社側で担保するしかないよねという話だと思いますけれども。
そうですね、結構自分たちで管理を求められるのがアクセスユーザーの居住地ですよね。
そこら辺…
グローバル…どうぞどうぞ。
実際どうするんですか。今ユーザーに居住地を入れてもらって、それで付分けするしかないと思いますけど。
そうですね。なのでそういう制約がある場合は、IT部がおそらく管理はしているので、IT部管轄におけるアクティブディレクトリ、そのユーザー情報が入っているサービスと紐づけないことには使えませんよってするのがセキュリティ側の言い分になっちゃうと思いますね。
自分たちでそういうアクティブディレクトリを立てて管理する時に、いちいちユーザーに居住地を入れてっていうのを妥当な理由で依頼することが難しいケースがあると思うので、
なんでそこまでの情報をオープンにしなきゃいけないんだみたいな、そこでトラブルになるくらいだったらもうIT部は管理できているんだから、IT部の認証機能を使ってて結果的に居住地が日本の人だけになってますよっていうのを担保する方が利用者目線でもいいかなっていう感じですかね。
それはそうでしょうけど、なんかそれもちょっと気持ち悪いなと思ってしまう気もしますけどね。
そうですね。グローバル企業とかだと、全員実は社内LANは同じセグメントになってて、海外リージョンの人でも普通にアクセスできる状態になってたとかいうのが後から分かってみたいな話もありますし、
そういうのはやっぱり気にしなきゃいけないよねっていう事実自体がハードルになるからこそこういう日本国内に事業を置いたりとかデータセンターを置くってことに意義があるんでしょうね。
そうですね。なんか話を聞いてて思いましたけど、そこら辺があるからこそ海外製のソフトウェアって部署で買うというよりは個人ユーザーが買うみたいな感じになるんですね、あれ。
そうでしょうね。
多分そういうことでしょうね。ソフトウェアで生成した成果物のアクセス権っていうのはソフトウェアが紐づいてて、ソフトウェアは個人ユーザーに紐づいてるからその人がどこ在住かで仕分けるっていう感じになってる気がしますね。
海外とかだと日本みたいに社員の入れ替わりが安定してないから頻度が高いんで確かにIT部みたいなところに管理させようと思っても無理がありますよね。
なるほど。
はい、というニュースで、日本としては本当に前向きなニュースなのでここからさらなる加速っていうのがあるかなという紹介でした。
はい。では次は私の方から2件目です。
ファルコンヘビー戦ジュピター3ブロードバンドジャイアントトワードジオステーショナリーオービットですね。
日本語で言うとファルコンヘビーが巨大ブロードバンドジュピター3号を静止軌道に向けて送り出すと。
まあGoogle翻訳ですけど。
というタイトルの記事になります。
エコースターのジュピター3衛星の打ち上げ成功
ちょっとGoogle翻訳でザクッと読むんですけども。
フロリダ州のSpaceXは7月28日にエコースターの9トンを超えるジュピター3を打ち上げ、世界で最も容量通信衛星を静止軌道に打ち上げることに成功しました。
Moxar Technologiesが生成した衛星は午後11時4分にフロリダ州ケネディ宇宙センターからファルコンヘビーで打ち上げれ、最悪3時間半後にロケットから分離された。
ファルコンヘビーのサイドブースターは再利用のため、7分余り後に近くのケープを奏でられる宇宙基地空港に着陸しました。
ジュピター3のブロードバンドサービスを提供する予定のエコースターの子会社ヒューズネットワークシステムは、衛星が打ち上げ後に最初の信号の操縦支援を開始し、技術者が太陽電池アレを配備したことを認めました。
このブロードバンドサービスは容量の制約が事業の重視となって、加入者を減らしている南北アメリカ大陸での需要の高めに対処することになる。
エコースターは最近、スペースXのスターリンクブロードバンドコンステレーションを含む市場での競争が激化する中、ヒューズのブロードバンド加入者は平均で前年比約15%多い大陸幅を使用していると発表しました。
この大陸幅の増加に対応するために今回打ち上げたとのことです。
マックサンシャインによると、このジュピター3Dはアンテナとソーラーパネルを格納した状態では標準的なスクールバスほどの大きさで、完全に展開した状態ではボーイング737機ほどの翼幅を持ち、これまでに製造した衛星の中で最大であるということで、
結構すごいのが、今までスペースXが打ち上げてきた単体で一番重い衛星というのがテルスター19 Vantageという名前のものなんですけど、これが7トンぐらいだったらしいですね。
そこから大幅に増加して今回9トンのものを打ち上げたということで、打ち上げ能力が確実に向上しているということが見られるということですね。
そうですね。私これいつもの薄井クリアちゃんのライブで見てたんですけど、どんどんどんどん進化して先に行っちゃうなーって思いながら見てはいましたね。
しれっとおっしゃる通りこの9トンというまた大きな能力アップをさらっとやり遂げているのはすごいし、もう慣れすぎて当たり前になっちゃいましたけど、普通に回収もできているしで、ほぼパーフェクトな打ち上げだったんじゃないかなと思ってて。
そうですね。ほぼパーフェクト。
実際、そうですね。直前にちょっとリスクがあったのがほぼじゃない部分くらいで。
ジュピター3の打ち上げ後の展開も今のところは問題ないというか、通信始められましたという状態なんですよね。
そうですね。はい。
いやーもう大したもんだなーって感じにしか言えることがない。H3もこれくらいの盛り上がりでいければよかったんですけど。
そうですね。これやっぱすごいなーと思うのが、今回ファルコンヘビーで打ち上げてて、もともとファルコンヘビーって人が乗る宇宙船用を想定して考えてたんで、めちゃくちゃ打ち上げ能力が大きいんですよね。
なるほど。
で、それの頭をすげ替えてというか、それを全部貨物用に振れるので、かなり打ち上げ能力が大きくて、こんな打ち上げ能力大きいもの何使うんだとか言われてたんですけど、今回こういうもので打ち上げることができた。
しかもできるだけ衛星に負担をかけないように打ち上げたというのは、能力が足りない場合は打ち上げた後、衛星側が頑張って軌道までヘコラヘコラ行くんですけど、今回そういうことなしでファルコンヘビーだけで精神衛生上に打ち上げたらしいので、めちゃくちゃすごいことしてたんで。
すごいですね。
どんだけ打ち上げ能力に余裕があるんだということをしてるっぽいんですけど、それも下段というかロケット本体の打ち上げ能力が大きいからできることなので、パワーがあるっていいことですねというところですね。
そうですね。その方法だったら衛星の内部実装としてなるべく多くの機能を実装できるでしょうし、動力とか何かついていると動力系と衛星としての機能部分というのをきれいに分離するためにやっぱり冗長的な仕掛けだったりとか、いろんな部品を間に挟ませる必要が出てくるので、
同じ重量でも乗せられる機能が大幅に下がるというところはあると思うんですけど、今おっしゃったやり方だったら衛星としてフルフル機能を持たせられたりもするでしょうから、ものすごいですね。
そうですね。やっぱりそういうことができるようになると何点ですかね。機能がいろいろ乗せれないからつって小分けにするとか、それもそれでコストもかかりますし打ち上げに時間もかかるみたいな状況を打破できるので。
今回のこのジュピダ3もめちゃくちゃ高性能で、待機幅が今までの全衛星を合わせた分ぐらいなので、待機幅が倍になるみたいな。どんだけ強すぎやねんみたいな感じで、毎秒500ギガビットぐらい性能が出るという、摂氏衛星上でやるには化け物みたいなものなんですけど。
これを1回ポンと打ち上げておしまいできるっていうのはかなり強いですよね。
すごいですね。これが加速していくと、もともとスターリンクが掲げてた全ての人たちにあまねくインターネットっていうのと、対災害性に強いインターネットっていうのが本当に目の前にやってきそうな雰囲気があって素晴らしいですね。
そうですね。やっぱり繋がらないと結構仕事にならんとかもあると思いますし、まじで海上とか災害地とかと地味に関わるので、こういうものがあるっていうのはいいところだと思いますね。
いいね。クルーズ船でしようとするのがますますはかどりますね。
まあ使える帯域は限られてはいるのは現状ではあるんで、あれではありますけど、最低限繋がるっていうことだけでもかなりありがたいですからね。
いやー素晴らしいですね。また気になる人は映像ぜひ見てもらったって感じかな。スペースXだからカメラ映像も面白いし。
いっぱいつけてるんでね。
はい、そんなところで。
では次行きます。
SVGフォーマットとChatGPTの活用
ChatGPTでSVGのイラストを描いてみようということで、Taste of Tech Topicsというアクロエンジニアデベロッピングブログですね。
別にニュースでも何でもないんじゃないんですけど、ChatGPTをこんな風に使うっていう発想が抜けてて何で思いつかなかったんだろうってめっちゃ目からウロコが出た話だったんで紹介したいです。
まずSVGが何かっていうところなんですけど、ベクトル方式でレンダリングする画像フォーマットですと。
具体的にどういうことかというと普通の画像だったらピクセルとか解像度が決まってて、その中にこのピクセルの場所には緑色だったり赤色だったりみたいな情報が入っててそれが表示されてるんですが、
SVGではここからここに線を引けとかそういう形で図形を描画したりするのが非常に得意なフォーマットになってます。
解像度を変えてもここからここにこういう線を引いてくれっていうような計算式になっているので、どんな端末で見ても同じようなアイコンとかSVGの画像に見えるといったところが有利なものです。
多くはWebブラウザー、ホームページ等で利用されているというところで、最近だとPowerPointとかそういったところのアイコンでも見られるようになりました。
このSVGなんですけれども、基本的には自分でベクトルを描くってことはあんまりなくてですね、世の中にあるSVGフォーマットのアイコンを探してきて、
PowerPointに貼ったりとかホームページに差し込んだりということが多いです。
中身を理解したら確かに自分の描きたいことを描けるんですけど、結構読めるっちゃ読めるんですけど、自分で手でゼロから描けるかと言われたらなかなか厳しいのがこのSVGフォーマットでした。
SVGタグで括って、全体のサイズはこれで、ここからここに線を引いてみたいなのとか、端点をどんどん置いてみたいな話をいっぱい書いていく感じになるんですけど、それをなかなか自分で書くのはかなり難しい。
そこでこのChatGPTを使おうという発想になっていて、ChatGPTではそのSVGの仕様を情報として持っているので、ChatGPTにSVGフォーマットでこういう画像、アイコンを出してくれと言ったらそれが出せますと。
実際私が試したのはWi-Fiアイコンとかルーターのアイコンとか、そういったものをいろいろ出してみてもらったんですけど、問題なく出せるというところがありました。
JAT GPTの便利な使い方
この使い方で何が素晴らしいかというと、まずSVGフォーマットなのでいろんなところで使い回しても困らないというところと、
自分たちがアーキテクチャ図とかいろんな説明図として登場人物を載せるときにアイコンとかを組み合わせて、矢印で繋いで繊維図を書いたりとかいろいろすると思うんですが、
そういったところのアイコンを作るにあたって、やっぱり探す時間だったりとか、
思ってるのはこうなんだけど微妙に違うんだけど、このアイコンでしゃーないかとかこのイラストでしゃーないかみたいに妥協することっていうのが結構あるんですよね。
そういったときにこのJAT GPTにパッと書かせればそのまま使えるというところで非常に便利ですと。
SVG自体はコードではあるんですけれども、別に何か著作権とか引っかかるようなそういう要素もほぼほぼないので、ただこういうふうに繊維図って書いてあるだけなので。
なので社内のIT規制的にJAT GPTでプログラミングとかを食わせてはいけないとか、社内資産に使って何か聞いてはいけないみたいなそういうルールって敷かれてると思うんですけど、
SVGを作らせるだけであれば別にオープンなJAT GPTでいくらやっても何も機微情報を含むようなものでもないから、
やりたい放題でかつその自分たちの生産性が上がるなというところで、非常に良い使い方だなと思っての紹介です。
はい、そうですね。ここら辺、手打ちでやるのはちょっと根性がありすぎるんで。
普通やってられない感じですけど、それをJAT GPTに書いてもらう?
それなりにしかも一文でこれこれ書いてって言ったら書いてくれてて、それなりに見れるっていうのは結構アドですねという感じですね。
これ記事中の例でいうと、例えばモンスターボールを書いてというと、モンスターボールっぽい上が白で下が赤で中央に○○がついててみたいな感じのものができてて、
まあまあモンスターボールだなみたいなことぐらいまで書けるので、こういう企画的な模様だったらアイコンにもちょうどいいですし、
その場で生成調整できるので、非常に便利かなというところですね。
でまあ、その次にピカチュウを書いてって言ってちょっとニコちゃんマークみたいなのが出てきてますけど、
こういう難しいのはちょっと難しいんで、まあそこら辺は本職に頼った方がいいと思いますけど、
なのでやっぱりアイコンとか概念図とかそういうのはこれで十分書けるので、まあそういう意味で重要かなというところですね。
そうですね。もっとテクノロジー的なところでも多分書けると思ってて、
例えばFETのアイコン回路アイコンをパッと書きたいとかそういった時数記号系ですよね。
あの辺も全部書いてくれると思いますし、
あとは何でしょうね、ネットワーク機器、ルーターとかその辺でも使えるでしょうし、
地図記号とかでも便利かな。
なので本当にいろんな場面でSVGって書きたいんですけど、
自分たちでSVGを書く技術がないから大体探すしかなかったっていう世界から自作できるに変わるんで、本当にいいと思いますね。
ちなみに今試しにChatGPT 3.5にFETの回路図記号を書いてって言ったらマークダウンで書いてもらいましたね。
SVGで書いてって言わないといけないですね。
なるほど。
ちなみにLDOあるじゃないですか、半導体の。
あれ書いてもらったらインアウトが両側にあって四角い灰色の図があって、
下にADJが二軸端子としてあるみたいな感じの図を書いてくれましたね。
そんなんだけでもとりあえずパッと何かのこんなものですよねを示したいだけのアイコンとしては十分かなっていう感じ。
なるほどね。
環境によってはそのままSVGをレンダリングしてくれない、ChatGPT上ではレンダリングしてくれないと思うので、
その場合はSVGビューアーとか何かインターネット上のものを使ってもいいですし、実際にPowerPointとかそういったものに取り込んでもらってもいいと思います。
はいはい。
そうですね。
うまくできないじゃないですか。
HTMLテキストで保存してHTMLで表示したら回路図記号には完成しなかったですね。
あらら。
3.5のところですね。
その辺は賢さがまだ足りないかな。
賢さが足りなかったかも。
GDP4ちゃんであればうまくいったかもしれないです。
はい、というところで活用事例としてご参考ください。
はい、というところでした。
はい。
セマンティックレイヤーの説明
最後、私の方からもう1個だけ。
セマンティックレイヤーとはというところで、
これは今後PodcastでまだまだAIの話をしていくと思うんですけれども、
このセマンティックなるものを知っておいていただけると、
今後の話についていきやすくなるかなというところで紹介です。
元の紹介記事としては、チュラデータ株式会社さんの前で公開されている記事です。
タクマンさんという方が書かれている記事になります。
セマンティックレイヤーとは、データベースとデータの利用者に、
データ利用者の間に入り、利用者間のやり取りを円滑にする存在です。
データ統合プラットフォームを提供するエアバイト社は、
セマンティックレイヤーをデータとビジネスユーザーの中間に位置する、
複雑なデータを理解可能なビジネスの概念に変換、翻訳するレイヤーと説明しています。
通常データベースにあるデータの利用には、利用者がデータの構造を理解した上で、
正確にSQLを書いてデータを取得する必要があります。
しかし、データを利用するのはエンジニアやアナリストだけではない今の時代、
それらのスキルを全てデータ利用者に求めるのは現実的ではありません。
そんな課題をセマンティックレイヤーは解決します。
セマンティックレイヤーを利用すると、データの利用者は売上、注文日などの慣れ親しんだ社内用語を、
ディメンション、メジャーなどを指定するだけでデータを利用できるようになります。
セマンティックレイヤーが指定された状況をもとにSQLを発行してくれるためです。
そもそもIT業界ではセマンティックという言葉は、与えられたデータや言葉の意味を解釈し、
適切なプログラムやデータに変換する技術に対して利用されます。
セマンティックレイヤーも慣れ親しんだビジネス用語をもとに、
データベースにとって適切な処理SQLを生成するという性質を持っているため、
セマンティックという言葉がついています。
中のセマンティックの技術については省略するんですけれども、
AIとセマンティックレイヤーの話が最近ではかなり重要視されています。
なぜかというと、ChatGPTには自然言語で入力します。
自然言語の入力をもとに必要な情報を足し合わせてChatGPTに聞くというような、
データの追加参照をもとに必要な答えを返すというようなAIのユースケースが増えています。
例えば、ある会社の売り上げ情報というPDFを食わせて、
その売上情報をもとに、昨年度の売上はいくらですかってChatGPTに聞くと、
そのPDFの中にある統計情報から、
昨年はこれくらいの数字だったようですって返してくれるというような、
そういうユースケースを考えたときに、
PDFからデータを取ってこないといけないというふうになります。
セマンティックレイヤーがないとどうなるのかというと、
そのデータを持ってくるにあたって、まずPDFではそのまま渡せないので、
PDFをスクレーピングして中のテキストデータを抜き出していきます。
テキストデータの中から関連性の強いものだったりとか、
文章の一塊というのを組み合わせて検索できるテーブルに置き直します。
そのテーブルに対して、自然言語の要求されているところから検索ワードを抽出し、
その検索ワードとそのテーブルを照らし合わせて、
これかなと思うやつを返すというような実装を自力で組む必要が出てきますけれども、
このセマンティックレイヤーというのは、
その自力で組んでいた部分をいい感じにやってくれるというものになっています。
このセマンティックレイヤーとChat GPTの組み合わせというのが信用性が高く、
今GPTをより活用する上では重要なレイヤーとなっているというところですね。
はい。
セマンティックレイヤーとAIの組み合わせ
あんまりわかっていないんですけれども、
もともとセマンティックレイヤーという概念があって、
それは指示を出したのをコードに変換してくれるものです。
Chat GPTが同じようなことができるようになってきたので、
Chat GPTを組み込むことで、
より使いやすいセマンティックレイヤーシステムができるのであろうというところで、
今後期待が高まっているという話ですかね。
ざっくりはそうです。
セマンティックレイヤーだけのときは、
自然言語で直接つなげられることもなくて、
データベースには、さっきのPDFで言ったら、
PDFから言ったテーブルに売上情報とか、
注文日みたいな情報をピックアップして、
テーブルに置いてある状態としますと。
そのときにユーザーが、
注文日とか売上という情報で集計条件だけ、
こんなのが欲しいんだよねっていうのだけ書いたら、
実際にそのテーブルに適用した形で、
データベースから抽出してくれると。
なるほど。
改変みたいな感じが今までできていたという感じですかね。
そうそう、読み替えはできていた。
それだけでなぜあんまり流行ってこなかったのかというと、
そういう投げ方すらもやっぱりちょっとお作法があると。
注文日とか売上っていう言葉を、
例えば発注日とかトップラインとか、
ビジネス用語とかに言い換えたときに、
クエリできるかというと多分できないんですよ。
なので確かにユーザーにとってやりやすくはなっているんだけど、
完璧ではないというところがあったわけですよね。
ちょっとした翻訳が残っている。
そこがちょっとGPTで翻訳しきれるっていうところですかね。
純粋に便利ですね。
欲しいですね。
そう。
セマンティックレイヤーとチャットGPTの親和性が、
それですごく発揮された結果、
このセマンティックレイヤーの価値が爆上がりしているって感じですかね。
なるほど。
セマンティックレイヤーが高度化すればするほど、
より様々なデータフォーマットに対応して、
チャットGPTに壊せられるようになるって感じですかね。
はいはい。
どうなんでしょうね。
いろいろ聞いてて思ったんですけど、
結構こういう変換でもがっつり自動的に全部生成してくれるっていう進化方向と、
セマンティックレイヤーの登場
コードを打ってたら保管してくれるっていう進化方法、
進化方法というかツールがあるじゃないですか。
今後プログラマーがプログラミングするってなった時は、
どっちの方がより種類になると想定されますか。
後者です。
後者ですか。なるほど。
確実に後者ですね。
そのチャットGPTで今言ったやり方でできる限界は、
もう想像に固くないと思うんですけど、
結局セマンティックレイヤーとGPTの翻訳能力で、
1位に定まる場合の話じゃないですか。
そうですね。はいはい。
でもデータってよく考えると、
例えば今月の売上ファイルと先月の売上ファイルがあって、
昨年のがある。
担当者が変わって実はフォーマットが違うっていうことが
往々にしてあると思うんですよね。
それってセマンティックレイヤーから見ても、
チャットGPTから見ても全然1位じゃないわけですよ。
なので結局セマンティックレイヤーが
完璧に処理できる未来っていうのはやってこなくて、
残りの20%を埋めてあげるための
データベースの整理っていうのはどっちにせよ必要で、
そこにはやはりプログラマーの力がいるんだろうなと思います。
なるほど。
じゃああくまでセマンティックレイヤーは
ポン付けでとりあえずデータを出したいといったときに、
考えるのも面倒、コードを考えるのも面倒なときに
パッと出せて。
そこから汎用性を持たせたツールとして作っていく上では、
後者のコード保管とかでゴリゴリ結局書いていく必要が出てくると。
なるほどね。
セマンティックレイヤーの後ろにいるデータが
単品の特定の1ファイルだったら多分何もやることはないんですけど、
やっぱりシステムを作るとね、
これも加わしたい、あれも加わしたいっていう要望が
どんどんやってくるもんじゃないですか。
そうですね。
それであれがキリにしてくれるのって言ったら、
ITどかたさんが頑張ってキリにするんですよ。
はいはい、なるほどね。
そうでしょうねと。
キリにする過程で、
もう1回またセマンティックレイヤーを分割して使うっていう世界は
全然あると思いますけどね。
なるほど。
このファイルをこういう風に解釈したいんだけどって言ったときに
セマンティックレイヤーとGPTを介して翻訳してもらって、
自分たちが求めるキレイなテーブルっていうのをめがけて
GPTにいろいろ頼み込むっていうタスクはあると思います。
それは1回限りの変換なので、
次はその入力と出力の変換情報を持って
GitHubコパイロット、コードを保管するようなプログラムに
この入力とこの出力を期待してるんだけど
このJISをやってっていうことをお願いして
コード化して自動で走らせるようにする。
で、あとは最後はそのコードをメンテナンスしていくって感じですかね。
なるほどね。
まあそれだけでもでもなんかううううなって書き換えて
XとY間違えてたみたいなことがなくなるので
そうですね。
かなりありがたいはありがたいですね。
ありがとうございます。
このセマンティックレイヤーの登場でまたその考えるプロセスというか
どういうものをエンジニアに任せて
どういうものをそのユーザー目線に作り込んだらいいのかっていうところが
分離していく話だと思うので
知っておいていい技術概念かなというところで紹介でした。
はーい。了解です。
はい。じゃあ今日はこんなもんですかね。
はい。本番ゲームはPodcast、Spotify、YouTubeリスナーにお答えできます。
そちらもサブスクライブよろしくお願いいたします。
はいではお疲れ様でした。
お疲れ様でした。