NASAとIBMが協力して開発している、AIによる宇宙研究のサポートモデル、この開発がかなり面白い局面を迎えているという、そんな内容が出てきたので、こちら紹介していきたいと思います。
NASAとIBMは、これまでにいろんな宇宙かけるAIの取り組みしてきました。
その中で今回は、科学者たちが科学研究を促進するためのサポートのAIの大規模言語モデル、インダスっていうのを開発した、そんなリリースがNASAとIBMから出ていたので、こちら紹介していきたいと思います。ぜひ最後までお付き合いください。
改めまして始まりました佐々木亮の宇宙話。 このチャンネルでは1日10分宇宙時間をテーマに、天文学で博士号を取得した専門家の亮が、毎日最新の宇宙トピックをお届けしております。
今日でエピソードが1628話目を迎えてますね。 基本的には一応簡潔でお話ししているので、気になるトピックからぜひぜひ聞いていただけたら嬉しいなと思っております。
ということで今回は先週に引き続きスポンサーさんついておりますパノスニックコネクト。 イエーイ!やったー!
2週連続でございますよ。 スポンサーさんがついているということは、
やる気がいつもよりも3割ぐらい増しているというような感じですね。 ということで、先週も宇宙かけるAIの話させていただいて、そのタイミングでもパノスニックコネクトの
スポンサーがついていただいてたんですけど、今回もそういった内容でお届けしていきたいと思います。
パノソニックコネクトの細かい紹介だったりとか、あと僕が明日発売しますね。 2025年2冊目になります。書籍
マーケティングをAIで超効率化。チャットGPT APIのビジネス活用入門。書籍の内容とかも後半でお話しさせていただきますので、ぜひぜひNASAとIBMの取り組みの後も楽しんで聞いてくれたら嬉しいです。
それでは行きましょうか本題に。 今回お話しするのはNASAとコンピューター作ってたりコンサルティングやってたりっていうIBMですね。
が協力して科学研究を促進するための大規模言語モデルインダスを開発したというところで、一体どんなものなのかお話ししていきたいと思います。
今回は科学研究をサポートする、宇宙の研究でものすごく使いやすいチャットGPTみたいなものを作っていますよ。
使えるようにしていってますよっていうそういうお話ですね。 大きな問題があって、例えば僕とかもこのポッドキャストで話すための論文をちょっと調べるとか、
あとはその話した内容を書き起こすとかっていうのもやってるんですよね。 今こうやってポッドキャストで喋った内容っていうのを僕手元のプログラムポチポチってやると、
このエピソードが勝手にプログラムがダウンロードしてきて、それをAIが書き起こししてくれて、その書き起こしの内容をAIがまとめて僕のホームページにある
宇宙系のブログに勝手に投稿されると。でなんかタグとかもそこにつけてみたいな感じでできるようにしてるんですね。
でまあそれやってるんだけど、一個大きな問題があって、専門用語だったりとかそういったのにやっぱ弱いと。
なぜならみんなが使うために作ってあるモデルだから、宇宙に特化したワードっていうのはそこまで細かくサポートされてないっていう話なんですよね。
そうすると、例えばなんだろうな、本当に専門用語みたいな話とかを入れていったりする。
どこまで認識されるのか、俺も定かじゃないんですけど、例えばなんかセファイドっていう言葉だったりとか、あとは
2つの星がぐるぐる回ってて、片方が片方を隠すみたいな感じで、触を作る。日食とか月食とかの触ですね。
そういう星が2つ連なっていることを触連成とかって言ったりするんですけど、
一般的な言葉じゃないから触連成って言われたら多分違う言葉に認識しちゃうんですよね。普通のAIっていうのは。
だからなんかこう専門的な話になっていけばいくほど、AIの感度が下がっていくっていう感覚ってあるんですよ。
そういうのがやっぱ課題としてある。だけどやっぱ最先端の研究をして、宇宙の未知の部分を解き明かしている人たちが、より研究がしやすくなる環境を作ってあげれば、
宇宙の解明のスピードも上がっていくし、もう最高なわけですよね。 なのでNASAとIBMは協力して、
それ専用の大規模言語モデル、チャットGPTの裏にあるみたいなやつのインダスっていうモデル、これを開発したんです。
インダスっていうのは、地球科学だったり生物、物理科学、太陽物理学、惑星科学、天体物理学っていうところの分野をサポートしているモデルになっていて、
科学用語を認識するためのカスタマイズがされているのが大きな特徴ですね、まず一つは。
そこがやっぱり重要で、一つ一つの単語っていうのをしっかりとっていて、6千億のトークンからなるコーパス、
簡単に言うと、6千億の要素を含んだ専門用語も多く含んだね、辞書みたいなのを用意して、それをAIに覚えさせてあげる、勉強させてあげるみたいな。
そういうことをすることによって、バイオマーカーって呼ばれる言葉あったり、リンサン化、リンサンね、
宇宙の生命とかの話をするときによく出ますけど、リンサン化って言葉だったりとか、そういった言葉とかもカバーできるようにした。
この中に含まれる5万個ぐらいの言葉っていうのの、5万個の語彙の半分以上はトレーニングに使用されたもので、特定の科学ドメイン、固有のもの。
つまり一般の会話では出てこないけど、科学者にとってはめちゃめちゃ重要な言葉っていうのを組み込んでるっていうのが、今回重要なポイントの一つになってくるわけですね。
これができるっていうのが重要。それでプラスして、あとはこれをベースに論文を見つけやすくしたりとか、あとはNASAが持っているオープンデータですね。
NASAって結構、世界中の研究者が好きに使えるようにデータを公開してるんですよ。
これ僕が1月の8日、今年の1月に発売した、やっぱり宇宙はすごいっていうSB新書の書籍の中でも紹介したんですけど、
NASAは基本的には公共団体であるみたいな姿勢がすごいから、特に僕がいたX線天文学の業界とかだと、
もう観測したデータは誰でも触っていいよみたいな状態で置いてあって、分析する用のソフトもそこに置いてあるみたいな状態。
だから誰がいつどのデータを触っても、論文に書いてある方法と同じことをすれば、同じ結果が得られるっていう、
それだけ科学に対してものすごく真摯な姿勢を持っているのがこのNASAの体制なんですよ。
で、NASAが持っているそういったオープンサイエンスデータとか、NASAのゴダードスペースフライトセンターっていうところの中にある、
これ僕が1年間いた研究所ですね。NASAゴダード地球科学データ情報サービスセンター、
ゲスディスクっていうところがあるんですけど、ここのデータセットだったりとか、こういったものをベースに入っているので、
このゲスディスクの中に入って、データを引用して出版物っていうのを研究するために必要な情報を引っこ抜くとか、
そういったこともできるようになっているモデルって感じみたいですね。
で、このオープンサイエンスデータの情報を統合した検索インターフェース、検索のできるエンジンみたいなのも載っているということで、
とにかくNASAの中の情報を専門用語までカバーしてAIで引き抜きやすくしているっていうのが今回のNASAとIBMが作ったこのインダスモデルってやつですね。
ちょっとね、僕も多分あんま使う用途ないかもしれないし、
これを聞いている人たちのほとんどが天文学者ではないはずなので、もしかしたら使うときはないかもしれないけど、
まあいい取り組みですよね。周りの研究者で使っている人もし見かけたら聞いてみようかなって思いますね。
それぐらいちょっと面白そうなので、これからもNASAとIBM衛星データの処理のAIとか色々作っていたので、
またちょっとPodcastで紹介できるタイミングがあったら紹介していこうかなと思っております。ぜひぜひ楽しみにしておいてくださいお願いします。
ということで、今回はNASAとIBMが協力して作った宇宙研究専用の大規模言語モデルインダス紹介させていただきました。
アフタートークです。はい、ということで、今回はまたAIかけ宇宙ですね。
まあ先週のエピソードでもAIかけ宇宙の話しましたけど、まあやっぱ好きなところの話をするのは面白いですよ。
昔よりも確実にAI関連の研究とかニュースっていうのが増えてきてるなっていう印象があるんで、
どこにもAIの波は押し寄せてるって感じですね。 ということでじゃあ今回はまあAIの話してるっていうのも
スポンサーについていただいたパナソニックコネクトがきっかけなので、ちょっとパナソニックコネクトの紹介をここで挟ませていただきます。
現場から社会を動かし未来へつなぐパナソニックコネクトのご紹介です。 パナソニックコネクトは技術革新を通じて多様な現場の課題を解決し社会課題の解決にも
貢献しているB2B企業です。 例えば製造や物流の自動化による人手不足の解消、
高速化を認証による空港やオフィスなどの入出上効率化、 カメラを活用したインフラ支援や災害時の情報管理など、私たちが安心安全にそして幸せに
暮らすためのソリューションを提供しております。 ソフトウェア開発からハードウェア実装まで幅広い領域で活躍しているフィールドがあり、
自分の強みを生かしより良い社会の実現に貢献できるのがパナソニックコネクトです ということで、先週のエピソードでも紹介したんですけど
パナソニックコネクトの AI の取り組みがマジで好きだっていう話ですね。
AI を使って会社の中の人材の業務効率化をどんどん進めましょうっていう取り組みが大々的に発表されていて、
それの評価の仕方っていうのがめちゃめちゃクリアで、 確かにそれぐらい効果出てるって言っても、なんか持ってる感じしなくていいよなーみたいな
何万時間何十万時間って出している会社とかがあっても、ちょっと大丈夫か?本当にそんなにか?みたいな思うんですけど
判断基準公開してくれてるのはちょっと嬉しかったりしますね。 確かあったはず。
会社で明日発売の AI で、マーケティングを AI で超効率化
ChatGPT API のビジネス活用入門の書籍、講談社から出させていただくんですけど、明日、3月28日発売ですよ。
で、それのこれも本当に AI を事業に活用しましょうっていうこのパナソニックコネクトがやっている内容と
噛み合っている? 食い合っちゃってはいないんですよ。大丈夫だと思いますよ。
僕らが社内で取り組んでいる内容だったりっていうのを、マーケティングっていうところにチューニングして紹介している内容なんですけど、
パナソニックコネクトのこの取り組みっていうところを、もう本当にね、参考にもさせてもらっているもう素晴らしい内容で、はい。
だからこそ、今回こうやってね、スポンサーのお話いただけて本当に嬉しかったなと思ってるんで、
もし AI のお仕事とかありましたら、ポッドキャストとは全然関係なく、またね、お仕事とかいただけたら嬉しいなと思っておりますと、ちょっとアプローチしておきましょう。
はい、ということで、素晴らしい機会をいただけて本当に良かったです。
パナソニックコネクトは技術革新を通じて多様な現場の課題を解決し、より良い社会、持続可能な未来の実現に貢献します。
ウェブサイトで活躍する社員のインタビューや最新ニュースを紹介していますので、ぜひ概要欄のリンクをクリックしてみてください。
以上、現場から社会を動かし未来へつなぐパナソニックコネクトの紹介でした。
今回スポンサー付いていただいて本当にありがとうございます。これからもちょっとね、いろいろ一緒にできることを祈って、宇宙話頑張っていきたいと思いますので、ぜひぜひ皆さんチェックしてみてください。
今回の話も面白いなと思ったら、お手元のポッドキャストアプリでフォローボタンの近くにある星マーク、こちらでレビューいただけたら嬉しいです。
そして、明日はなんと3月の28日、僕の今年2冊目の本ですね。
AIの本出ますんで、まだアマゾンでご購入の予約してない方はチェックしておいてください。よろしくお願いいたします。
ということで、じゃあまた明日お会いしましょう。明日はちょっとね、本の話しようかな。なので2日続けてAIの話です。
もっと頑張って、頑張って噛み砕いて話そうと思うんで、明日も楽しみにしておいてください。それではまたお会いしましょう。バイバーイ。