1. 佐々木亮の宇宙ばなし
  2. 1038. 衛星データ難しすぎるか..
2023-08-12 18:35

1038. 衛星データ難しすぎるからNASAがみんなのためにAI公開してくれた【IBM】【Hugging Face】

IBM x NASAで作られた衛星データAIモデルが、AIモデルプラットフォームFugging Faceで公開された!これを使えば誰でも衛星データスペシャリスト!!データサイエンティスト目線で、宇宙AIモデルの話をしています。


CROSSPODディレクターズカット版公開されました!!聴き逃した方、是非チェックしてください!銀シャリの橋本直さん、chelmicoの鈴木真海子さん、ありがとうございました!

https://music.amazon.co.jp/podcasts/044228b7-f166-48e4-a57e-d0132329cd28/episodes/bba64d38-86a1-4b62-a755-66e0d85cc061/%E6%A9%8B%E6%9C%AC%E7%9B%B4%E3%81%A8%E9%88%B4%E6%9C%A8%E7%9C%9F%E6%B5%B7%E5%AD%90%E3%81%AEcrosspod-035-%E3%82%B2%E3%82%B9%E3%83%88%EF%BC%9A%E4%BD%90%E3%80%85%E6%9C%A8%E4%BA%AE%EF%BC%88%E5%89%8D%E7%B7%A8%EF%BC%89


お便りコーナーはこちら!

⁠⁠https://forms.gle/CmDJj6w9UCoz8HRn8⁠⁠


もう1つのチャンネル「となりのデータ分析屋さん」はこちら!

Spotify

⁠https://open.spotify.com/show/0Gz5oreIawFvFbvRD13BQU⁠

Apple

⁠https://podcasts.apple.com/jp/podcast/%E3%81%A8%E3%81%AA%E3%82%8A%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90%E5%B1%8B%E3%81%95%E3%82%93/id1679672794⁠

Amazon

⁠⁠https://music.amazon.co.jp/podcasts/2f1fcc0b-e853-45ae-bf1a-67983a80533a/%E3%81%A8%E3%81%AA%E3%82%8A%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90%E5%B1%8B%E3%81%95%E3%82%93⁠⁠


Youtubeチャンネルも更新中

⁠https://www.youtube.com/channel/UCHW6gg92z7E7hdnhbStpzTA⁠

Instagram(ryo_astro)

⁠https://www.instagram.com/ryo_astro/⁠

個人ホームページはこちら!

⁠http://ryosasaki.net/⁠

Voicy

⁠https://voicy.jp/channel/1726⁠

Twitter(_ryo_astro)

⁠https://twitter.com/_ryo_astro⁠

note

⁠https://note.com/ryo_sasaki⁠

ジングル作成:モリグチさんfromワクワクラジオ

⁠https://open.spotify.com/show/3LYTJRlUlb9wU7geQyoDzE?si=c178010fd8154ea9⁠

ソース

https://newsroom.ibm.com/2023-08-03-IBM-and-NASA-Open-Source-Largest-Geospatial-AI-Foundation-Model-on-Hugging-Face

https://sorabatake.jp/33186/

Credit : IBM / NASA

--- Send in a voice message: https://podcasters.spotify.com/pod/show/ryo-sasaki/message
00:02
1日10分、宇宙時間をテーマに毎日お届けしております、宇宙話。
今回は、NASA、そしてIBMが公開した、世界全員が使える地球観測衛星を用いたAIモデル、こちらについて紹介していきたいと思います。
誰もが、最近はもう触れる機会があるAI、それかける宇宙っていうところのデータのお話を今回はしていこうかなと思っていて、これから地球を観測する人工衛星のデータ、どんどんみんなが使えるように広く浸透していく。
それの走りとしてNASAが世界中に向けたAIの公開を行ったというところで、かなり面白い取り組みになっております。
ぜひ最後までお付き合いください。
3、2、1、イギネション。
佐々木亮の宇宙話。
2023年8月12日始まりました、佐々木亮の宇宙話。
このチャンネルでは、1日10分、宇宙時間をテーマに、天文学で博士号を取得した専門家の亮が、毎日最新の宇宙トピックをお届けしております。
本日でエピソードが1038話目を迎えております。
基本的には1話完結でお話ししておりますので、過去の気になるトピックからぜひ聞いていただけたら嬉しいなと思っております。
今回は宇宙ビジネスっぽい話であり、尚且つ未来の宇宙開発にとって重要な役割を担いそうな、IBMとNASAが協力して作ったAIのモデルについて紹介していきたいと思います。
今回の話は、時代の転換点だなっていうのをすごい感じるところであり、僕、天文の研究とかやっていたところから、今はデータサイエンスとかそういったところの仕事をしてるんですね。
いわゆるAI活用したりとか、データ分析して仕事するみたいな、ビジネス上の課題を、難しいことを言うような仕事をしてるんですよ。
そんな中で、こういうAIのプラットフォームが出るみたいな話っていうのは結構面白いなって思うところなので、そういうデータを普段から触っている人目線、
そして宇宙専門でずっとやってきたっていうところの目線でお話ししていけると、結構面白い話になるんじゃないかなと思って、こんな話をしていこうかなと思っております。
今回の話なんですけど、そもそも僕どこでこの話を見つけたかっていうと、僕が前にライターとかもやらせていただいていた空畑っていう宇宙ビジネスメディアがあるんですね。
そこのニュースとして出ていて、何これと思って、本家のIBMとかNASAが出しているプレスリリースまで見に行ったというようなところでお話ししていきたいと思っております。
03:11
今回発表されたのは、IBMっていうIT系の会社ではめちゃめちゃ有名ですね。
IBMとNASAが衛星のデータから構築したAIモデルっていうのを誰でも使えるような状態で公開したっていうような、そういうニュースになっています。
今のこれしかもどういうデータを扱うかっていうと、人工衛星が地球を観測して、そのデータをAIにかけることによっていろんなことがわかるっていうような、そういうモデルなんですよね。
で、これざっくりどんなことしてくれるかっていうと、本当に衛星データってデータ量がもうはちゃめちゃにあるんですよ。
ちゃんと全部自動でデータを処理できるようにしないと、どうしても最新のデータを手につけるとか、そういったところってなかなか追いつかないっていう課題があるんですね。
そういったところで、たくさん大量に取ったデータを、そういうデータを処理してくれて特徴のあるところをつかんでくれるAIがあれば、最新の情報っていうのを取りに行きやすいというようなところで、
IBMとNASAが協力して作っていたAIモデルっていう感じなんですね。
これなんかいろいろできそうな感じするんですけど、プレスリリースの内容とかを見てみると、例えば洪水とか、洪水とかを検出できるっていうような話があったりとか、
あとなんだっけな、すっかり忘れちゃったな、さっきまでたくさん英語の文章見てたらどんなことができるのかいまいちよくわかんなくなっちゃったとか、
あとは地面の、それぞれの地面のデータの処理とかもしてくれたりするし、あとはバーンスカーズセグメントっていうところがあるから、
燃えたりしてるところなのかな、山火事か、火事の焼け跡とか、そういったところのマッピングができるようなモデルが作られたっていうところなんですね。
人工衛星のデータっていうのは、さっき言ったみたいなデータ量がもう豊富にありすぎて、最新のところに追いつくのが難しいっていう課題があったというところにプラスして、
地球を観測してる人工衛星のデータって、どういう活用方法があるのかっていう話になってくると、やっぱりそういう山火事とか火事みたいなものを検出したり、
洪水とかっていうような、いわゆる災害っていうところに区分されるような活用のされ方が一番ポピュラーというか、一番使われてる事例としてよく出てくるものなんですよね。
06:03
だから多分NASAもIBMもまずはそこから手をつけるっていうような感じで、そこら辺のデータをしっかりときれいに取れるようにするAIのモデルを作ったと。
つまり、今まで人間がパソコンにこうやってやれって動かしてて、データを処理したものから、じゃあこういう基準で洪水の情報を抜き取ってこようか、
じゃあまた全部データにかけてとか、火事の状況って人工衛星のデータだとこういう風に見えるだろうから、じゃあこういう色のついたもの、こういう赤いエリアとか真っ黒くなっちゃったエリアだけ抜き出そう、
こういうプログラム組んでっていう感じでデータを処理してたんですけど、やっぱり細かーい基準とかって調整するのは大変なんですよね。
しかもこれって研究者だったりエンジニアだったりのそれぞれの人が毎回、例えば会社とかが違うと別のモデルを作ってとか別のプログラミングを書いて、
AIじゃなくてもね、見つけるっていうような感じで、技術がまちまちになっちゃうから底上げされてこないというような課題があるから、
NASAは民間から技術力のある会社を選んで、もうみんなこれ使えば山火事とか洪水とかそういったところのデータ取れるよっていうようなものを作っちゃったというようなところが今回の面白いポイントの一つとして出ていますね。
こういうところに特化したモデルっていうのをまずは作りましたっていうのが今回のリリースになっていて、本当に誰でも触れるような感じでデータが公開されてるんですよ。
もうなんか時代ですよね。今までってこういうデータとかこういう技術力っていうのはもう自分たちで隠しておきたい。
これは自分たちが自分たちの利益のために使うんだっていうような結構秘匿なデータだと思ってるんですよ。
けど、今の時代は本当に自分たちで作ったものをどんどん外に出していって、そこで技術力の高さを見せて、あとはまた他の人たちがそれに対応していろんなものを作っていって、
どんどんどんどん世の中のレベルが上がっていくっていうような、そういう技術力の発展の仕方なんですよ。
だからこそ今回の着手の仕方っていうのはなかなか面白い側面が強いなぁと個人的には思っていたりするというようなところですね。
で、これもうちょっとデータ詳しい人向けの話というか、今回このAIモデルっていうのが作られたのは、作られて公開された場所っていうのがハギングフェイスっていうプラットフォームなんですね。
ハギングフェイス。すっげー直訳すると笑顔。笑ってる顔ですね。で、このハギングフェイスっていうプラットフォームは本当にすごくて、僕もお世話になってるんですけど、
09:01
世界中のあらゆるユーザーがAIのモデルとかっていうのを公開するためのプラットフォームなんですよ。
つまり、なんとなくAIの使い方わかってる人とかで、自分がやりたいなぁと思ったこと、もしかしたら誰かやってるかもしれない。
だってこんなこと誰でも思いつくもんな。みたいな課題って結構あるんですよ。
そういうのを、じゃあハギングフェイスにモデルあるかなーって調べに行くと、もう誰かがAIのモデル作ってくれちゃってるんですよね。
じゃあそのモデル作ってるんだったら、じゃあそれ使わせてよみたいな。
っていうので、使ってもいいよって公開してるプラットフォームからデータをもらってきて、データというかもうAI自体をもらってきて、自分のところで使ってみる。
そうすると、自分で一からAIのモデルを作らなくても、人が頑張って作ってくれたAIのモデルを使って課題を解決できると。
で、なんならそのモデルでここまでできるんだっていうのがわかったら、じゃあ今回みたいに、今回NASAとIBMは洪水とか火事の焼け跡っていうところを見つけるようなAIになってるけど、
そうじゃなくて、もうちょっと違う森林伐採の情報だったり、農作物の収穫量の予想だったりとか、そういったところにチューニングしていこうっていうような感じで、
自分のタスクに合ったようなものをさらに作っていけるっていうような、そういった感じなんですよね。
だからこそ、このHugging Faceっていうプラットフォームは世界中のAIユーザーに結構愛されている場になっていて、
そこにIBMとかNASAっていうのも、今回AIモデルを投下していったというようなところで、これによって狙ってるところ、
例えばそのプレスリリースの中で話している内容とかで言うと、これからの人工衛星のデータの利活用をより促進するために今回モデルを広げましたと。
さっき話したみたいな、人工衛星のデータを使うっていうところには、かなり大きな壁が存在する。
データ量だったりとか、データを扱うテクニックだったりとか、そういったところをAIで代替してあげることによって、
今後のAI×科学、AI×宇宙、AI×衛星データっていうようなところの目線をより加速させていけるっていうような、そういう狙いがあるっていうところを話しているんですね。
素敵な、本当に素敵な取り組みだし、これは多分NASAが噛んでいるからこそ、こういうオープンデータにできているっていう側面があって、
多分IBMだけで作ってたらオープンソースにはならないんですよね。だって囲ってた方が、それで商売できるじゃないですか。
けどそういったテーマじゃなくて、世界中の衛星データへの理解、ちょっとカッコつけた言葉を言うとリテラシーみたいなものっていうのを底上げするために、
12:00
もう僕らでNASAも協力してお金使ってAIのモデル作ったんだから、世界中みんなで使って大加速していこうよっていうような、そういった取り組みですね。
これによってきっと人工衛星のデータを触っていく人っていうのが少なからず増えてくると思うんですよ。
実際にこれプレスリリースが出たのが8月の3日とかなんですね。今が2023年の8月11日なのでちょうど1週間前っていう感じで、
その1週間前に公開されたモデル、今の4種類ぐらいハギングフェイス上で今モデルが出てるんですけど、
例えばそのヤマカジを検出するみたいなところだと10いいねついていたりするし、なんかもうちょっと総合的にいろんなもの見えるような、
特化してるものではないモデルとかだと113いいねとかついてるんですよ。
僕これ話そうかなと思って見てたときで111とかだったんで、今もうすでに使われてる人とかいるんだみたいなっていうところを実感させられる。
本当にこのハギングフェイスっていうプラットフォームはモデルを透過していろんな人が使って、これめっちゃいいじゃんってなったらいいねとかしてくれるんですよね。
それが今一番使われているもので113いいね、1週間で。
しかもそれに対してこういう使い方したっていうような使われ方の事例とかも今後出てくるし、
あとはこのデータ使って何かしたい場合はサイテーション、つまり参照したよっていうのをちゃんと入れてねとかっていう文言も書いてあって、
これからいろんな論文、それこそ今回ってあれをやってほしいんですよ。
科学的な成果につなげてほしいっていうところになってるから、それをどんどんどんどん使ってもらうっていう意味でかなり重要な役割を担ってきそうですね。
一番使われているモデル113項とかってなってたりするのはもう本当にやっぱいろんなデータが組み込まれているものだし、
あとはなんだこれマルチテンポラルクロップクラシフィケーション、つまり穀物、作物とかのクラシフィケーションをしていきましょう。
つまり分類をしていきましょうってなると、ちょっと性能的にはどうなんだろうな。
まあまあまあ良さそうなもの6割ぐらいは当ててくれるよみたいなものが出てて、水場とかだったら90%ぐらいの性能だったりするけど、コーンとかだと65%とか。
でソイビーンズ、豆とかだったら67%ぐらいの精度で人工衛星のデータから抜いてこれるよみたいなところがあったりしますね。
あとはいろいろ出ていたりするので、もしAIのデータとか触れるよみたいな人いたら、ぜひですねこのハギングフェイスでいろいろ見てみると、
15:01
人工衛星のデータこれから触っていこうと思ったりしたら結構面白い時代に突入してきたんじゃないかなというふうに思いますね。
でまあこういうところのデータの話もし興味ある人いたら、僕実は今最近話してるんですけど、
ポッドキャストもう1個始めていて、隣のデータ分析屋さんっていうデータ分析に関するポッドキャストを始めてます。
なのでそちらでもたまーに宇宙のデータの話とかもするんで、データサイエンスとか興味ある人はそっちも聞いていただけたらいいんじゃないかなと思いますね。
こういう話をもう本当にめちゃめちゃしてます。
はい、ということで今回は IBMとNASAがコラボレーションして作ったAIモデルっていうところが世界中誰でも使えるような状態で公開された、そんなお話をさせていただきました。
ぜひですねデータの興味ある人はソースとか書いてあるので概要欄から覗きに行ってほしいですし、
データ全般気になるんだよねーみたいな人いたら、ぜひですね隣のデータ分析屋さん聞いていただけたらと思います。
これリクエストとかあったらそっちの番組でもっとデータ面でがっつり深掘っていけるっていうのもあると思うんで、コメント皆さんぜひください。
ということでですね本題は以上にしていこうかなと思っていて、
そうですね今科学系ポッドキャストの取り組みどんどんどんどん広がってます。
2回前のエピソードとかだと階段っていうところで科学系ポッドキャストの共通トークテーマでいろいろお話ししてて、
他の科学系の番組もそういった取り組み今やってるのでぜひいろんなの聞いてみてください。
最近科学系勢いすごいのでね。
でそんな中で中心で動いてくれてる一人がサイエントーク、サイエンマニアっていう番組やってるレンさんなんですけど、
レンさんなんと今週末?違うわ来週だ。来週末ですね。
2023年の8月の10…いくつだったかな。
あの休日に東京でなんとサイエントークのイベントをやると。
詳しくは番組聞いてねっていうことだったんで、ちょっとね科学系の番組でイベントっていうところやると、
どんな感じになるのかなって。
ここで勢いが増してくるとかなり面白いことになりそうなので、
ぜひですねサイエントーク興味ある人は聞きに行ってみていただけたら嬉しいなと思っております。
レンさんはね、今年の2023年の頭に僕大阪で一緒にイベントやらせてもらって、
その時にはなんかこう、科学面白いよねみたいな話をわーってしたんですけど、
まあさすがね、ポッドキャスターだから人前に立つというか立ってなんか喋るっていうのも
うまいなーって思いながら横から見ていたので、
でも結構楽しいイベントになるんじゃないかなと思います。
詳細もろもろはサイエントークで話しているみたいなので、ぜひチェックしてみてください。
18:01
今回の話も面白いなと思ったらお手元のポッドキャスターアプリでフォロー。
フォローボタンの近くにあるレビュー、ぜひよろしくお願いします。
これがかなりモチベーションにつながっているので、皆さんのレビューお待ちしております。
番組の感想や宇宙に関する質問については、
Twitterのハッシュタグ宇宙話し、または概要欄のお便りコーナーだったり、
SpotifyのQ&Aコーナーからじゃんじゃんお寄せいただけたら嬉しいです。
それではまた明日お会いしましょう。さよならー。
18:35

コメント

スクロール