1. サイエントーク
  2. 158. タンパク質構造予測は世..
2024-12-19 43:16

158. タンパク質構造予測は世界を変える!AlphaFold誕生までの70年の歴史【聴くだけノーベル化学賞2024】

spotify apple_podcasts youtube

サイエントークを聴いてくださっている全ての方へ!

私たちに1分だけ時間をください!

下記リンクからポッドキャストアワードの投票をお願いします。サイエンスの面白さをもっと深掘りできる活動や番組作りに必ず繋げます!

https://ssl.1242.com/aplform/form/aplform.php?fcode=jpa2024_general ポッドキャストシンポジウム2024のアーカイブ配信が開始!

https://note.com/scientalk/n/n8e59a30256a3


💬トピック

ノーベル化学賞もAI / タンパク質の構造とは? / タンパク質の形をX線で見る / タンパク質の構造は絶対? / リボヌクレアーゼの構造 / タンパク質計算の難易度 / 構造予測の世界大会 / DeepMindの登場 / チェスの達人デミス・ハサビス CEO / 天才ジョン・ジャンパー / トランスフォーマー / Alphafold2の誕生 / オリジナルタンパク質の予測 / デイヴィッド・ベイカーとロゼッタ / AIで何ができる? / ポッドキャストアワードの投票ありがとう!


📚参考文献

The Nobel Prize in Chemistry 2024

今更だけどAlphafoldって何?ノーベル化学賞の技術とは


🧬おたよりやコミュニティなどはサイエントーク公式サイトへ!

https://scien-talk.com/


🐈‍⬛関連番組: サイエンマニア

レンがゲストと世界を探求する番組

⁠⁠⁠⁠⁠⁠⁠https://scientalkclub.wixsite.com/scienmania⁠⁠⁠⁠⁠⁠⁠


🧠新ポッドキャスト「脳パカラジオ」

⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apple podcast⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Spotify⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

脳パカラジオで検索!


🌏SNS

X(Twitter): https://twitter.com/SciEn_TALK

Instagram: https://www.instagram.com/scien_talk/


🧪新ポッドキャスト サイエンスディスカバリー!

サイエントークのプロフィールエピソードも配信されています。

サイエンスディスカバリーで検索!

🟥YouTube

⁠⁠⁠⁠⁠⁠⁠https://www.youtube.com/channel/UCn3buED4vDrWdPi3E_POGVQ⁠⁠⁠⁠⁠⁠⁠

映像協力: 自走形remonさん(https://note.com/runningremon/)、ツバサさ

(https://twitter.com/283create)


🎧BGM

オープニング:サイエントークのはじまり(オリジナル)

トークBGM:⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠DOVA-SYNDROME⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠、⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠トーマス大森音楽工房⁠⁠⁠⁠⁠⁠⁠、RYU ITO

サマリー

本エピソードでは、アルファフォールドの誕生までの70年の歴史において、タンパク質構造解析の重要性が語られています。AI技術がタンパク質の構造予測にどのように革命をもたらしたのか、さらにはそれがノーベル賞に結びついた背景について深掘りされています。タンパク質構造予測の過去70年を振り返り、その中で重要な発見と技術革新があったことが解説されています。特に、ディープマインドによるAlphaFoldの開発が分子生物学の研究に与えた影響とその実績について詳しく述べられています。タンパク質構造予測の進展は、AlphaFoldの登場によって新たな局面を迎えています。70年の研究の成果として、AIを用いたタンパク質の構造予測が可能となり、今後の医療やバイオ技術への応用が期待されています。タンパク質の構造予測に関する70年の歴史を通じて、AlphaFoldが登場し、研究分野に大きな変革をもたらしています。これにより、これまでに発見された多くのタンパク質の構造が予測され、今後の研究が加速する見込みです。

ノーベル化学賞とタンパク質の関係
スピーカー 2
レンです。エマです。サイエントークは、研究者とOLが科学をエンタメっぽく語るポッドキャストです。
スピーカー 1
今日はノーベル賞の回です。たまにはちょっとストレートに言います。
スピーカー 2
確かに。いつもさ、何かしらのクイズみたいな挟んでから行くもんね、お題に。それがない。
スピーカー 1
もうストレートに行きますね。今日ね、紹介したやつはね、僕はすごい好きなんですよ、話として。
スピーカー 2
ノーベル化学賞。化学?化学です。知ってます?知らない。今年は何が受賞したんですか?
今年はですね、これもAI関連で。科学もAIなんだ。
科学もAI。ちなみにそれ前回言ったんですけどね。忘れてますね。
スピーカー 1
ちょっと収録の時間空いたんで。僕がね、体調不良になったり、交通事故に巻き込まれたり、いろいろあったんで、それはまた今度話すとして。
大変でしたね。大変でした。今日はですね、タンパク質の構造解析の話をします。
スピーカー 2
確かにそれはAIが必要そうな複雑なイメージがあるから、でもなんかどういうふうにAIが使われているのかがよくわからないので教えてください。
スピーカー 1
よくわからないよね。そもそもタンパク質の構造みたいな話は本当に超有名ではあるんだけど、知らない人からしたら、なんでタンパク質とAI関係があるのって感じもするかなと思う。
だってタンパク質って言ったら一番最初に浮かぶのはやっぱり食べ物ですよね。
スピーカー 2
プロテインだよね。
スピーカー 1
プロテインですよね。飲んでます、僕。
スピーカー 2
私も飲んでます。昨日飲みました、筋トレ後に。
スピーカー 1
飲みました。まあまあそのタンパク質なんですけど、それの形を予測するっていうのがめちゃくちゃ重要で、それにもうAIが使われまくって、今これが激アツな技術なわけですよ、すごい。
そしてそんな最近できた技術にノーベル賞がもう出たっていう。
スピーカー 2
いつ頃からさ、AIがタンパク質の構造解析に使われ始めたの?
タンパク質の構造とは
スピーカー 2
今日本当その歴史の話をしたいよ。
じゃあもう初めから追っていっていただけるということで。
スピーカー 1
もう喋っていいですか?
どうぞ。
とりあえず受賞した人まず言いますね。
スピーカー 2
そうですね、それ一番大事だね。
スピーカー 1
受賞した人はアメリカワシントン大学のデイビット・ベイカー教授。
スピーカー 2
この人はAIの人?それとも科学の人?
スピーカー 1
この人はAIの人、てかもうAIの人です。
ディープマインドっていう会社がありまして、
このディープマインドっていう会社は今グーグルのグループ会社になってるんですね。
ロンドンに本社があるらしい、ディープマインド。
スピーカー 2
マジか、今度行くかじゃあ。
スピーカー 1
そこのCEO。
スピーカー 2
CEOが受賞するんだね、面白い。
スピーカー 1
これ結構すごいことで、デミス・ハサビスさんっていう人。
この人めちゃめちゃ今メディア出てますね。
っていう人と、その会社でアルファフォールド2っていうソフトの名前。
これを作るのに関わったっていう、そこの研究チームのジョン・ジャンパーさんっていう。
この3人が受賞したの。
全員これディープマインドっていう会社に関わってるんですね。
この会社、多分日本でめっちゃ有名になったのは、
アルファ5、イゴの5のニュース見てないですか?
スピーカー 2
知らない。
スピーカー 1
AIがイゴの世界チャンピオンに勝ったっていうニュースがすごい出たんですよ。
その会社がイゴじゃなくて、なぜかタンパク質の分野でしかもノーベル賞を取っちゃうような技術を作ったっていうことなんですよね。
スピーカー 2
すごいね。めっちゃ株価とか上がりそう。
スピーカー 1
爆上がりですよ。爆上がりというか、Googleに買収されてるからすごいんだよ。
スピーカー 2
確かに。
スピーカー 1
っていう話ですね。早速していきますか。
そしたら、AIの話が出てくる前に、まずなんでタンパク質の構造なんだっていう話から一応しますけど、
タンパク質って何ですか?どういう構成要素からできてますか?
スピーカー 2
アミノ酸?
スピーカー 1
そう、アミノ酸ですね。
普通の天然アミノ酸って20種類あって、その20種類が樹酢みたいに繋がって、それが特定の形に折りたたまってできてるのがタンパク質。
っていうことは、多分学校でも習うのかなと思います。
アミノ酸がバーって繋がってる間にニョロニョロニョロっていう紐を想像してもらったらいいんだけど、
その紐が特定のパターンだとこういう形に並びます。
グニャって固まる。それをタンパク質の構造って言ってる。
スピーカー 2
パターンっていうのは、そのアミノ酸の並び方っていうこと?
スピーカー 1
並び方もそうだし、遠くに離れたアミノ酸でも、例えば酸性と塩域性のアミノ酸があったら近寄りやすいよねっていうので、遠くがギュッと近寄ってるような形になるとか。
スピーカー 2
それも結局アミノ酸の並び方ってことだよね。
スピーカー 1
そうだね。並び方によってうまいこと起きる。
これが、まずそもそもこういう構造になってるって知られたのって1950年くらいだね。
スピーカー 2
でもタンパク質はタンパク質でもいろんなタンパク質があるじゃん。
だからこういう形だよねっていうのは一つに定まるものではないよね。
スピーカー 1
そうだね。
スピーカー 2
折りたたまってるっていうその一般的なその状態がわかったのが1950年っていうことか。
スピーカー 1
アミノ酸からできてるとかはもうちょっと昔からわかってるんだけど、見ることはできないわけじゃないですか僕たち。
タンパク質って言っても目に見えるサイズじゃないわけよ。
1個のタンパク質って。
僕らの体もタンパク質から大体体の10%とか20%ぐらいはタンパク質でできてますけど、
それってタンパク質がめちゃくちゃいっぱい集まって見えてるわけで、
1個のタンパク質がこうだよねっていうのはどんなに頑張っても見えないわけで。
初めてそれをX線っていうものを使って見えるようになりましたっていうのが1950年代で。
スピーカー 2
なるほどね。
スピーカー 1
タンパク質ってこういう形だったんだっていうのが初めて人間の目に触れたというか。
スピーカー 2
じゃあ具体的なタンパク質の一つの形がもうX線でちゃんと見えるようになったっていうのが1950年だね。
スピーカー 1
ちなみにこれもノーベル賞取ってますね。
しかも1962年のノーベル科学賞です。
スピーカー 2
10年後ぐらいに取ったのね。
スピーカー 1
これは科学なんですよね。
そこからまた別な研究者なんだけど、今ある天然に存在するタンパク質あるじゃないですか。
これを1回紐状に伸ばしてそれをもう1回折りたたむっていう。
実験をした人がいるの。
熱とかかけると紐くちゃくちゃくちゃってなったやつが1回ほどけて、
それをほっといたらもう1回同じ構造を組むのかなっていうのを調べると。
そうすると同じ構造に戻るっていうのを発見した人がいるのね。
これ1960年ぐらい。
スピーカー 2
ちなみに今熱をかけてきたけどさ、ちょっと思い出したのが卵とかを焼くと変形しちゃうから戻らないみたいな。
それとはまた別?
スピーカー 1
それとはまた別だね。
卵とかはもう凝集したりとかしてる。
だけどこれやったのはぶっ壊れるまではやらないんだけど。
スピーカー 2
紐に伸ばすみたいな。
スピーカー 1
塩とかいろんなものを入れて、なるべく折りたたむような結合を切る試薬とかをいっぱい入れて、
1回伸ばして、で、もう1回水に戻したらどうなるかなとか。
そういう感じだよね。
だからそれは誰もやってなかったよ。
今あるタンパク質見たらこういう形だよねっていうのは分かったんだけど、
それって同じ網戸さんの並びだったら絶対この形になるのかなっていうのは確かめてなかった。
だって同じ網戸さんの並びでもあるときはこういう形になって、あるときはまた違う形になってってなる可能性もあるじゃん。
スピーカー 2
そうだね。周りの環境に応じて。
てかそういう感じなのかと思ってた。周りの酸性とか塩基性とかそういうのによってちょっと形変わるのかと思ってたけど。
スピーカー 1
ちょっと変わるんだけど、基本的に同じ形になるっていう。
スピーカー 2
そっか、じゃあ同じ条件に戻してあげるともう全部一緒の形になっちゃうんだ。
スピーカー 1
だから条件さえ揃えてあげれば、この特定の網戸さんがこういう風に並ぶとこの立体構造になるよねっていうこと。
まずこれが分かったと。
スピーカー 2
それがいつ?
スピーカー 1
これが1961年です。
ちなみにこの結果にもノーベル賞出てます。
スピーカー 2
そんなにすごいことなんだ、それって。
AIとアルファフォールドの誕生
スピーカー 1
これ1972年の、これもノーベル科学賞なんですけど。
これってさ、今話した話って、まあへえそうなんだって感じじゃん。
まあ一個の並び方決まって、それが勝手にパズルみたいに組み上がって毎回同じになるっていうのはまあまあそんなもんかっていう感じもするじゃん。
スピーカー 2
そうだね。
スピーカー 1
だけどそれって本当にそうなみたいな。って言った人いて、これまた別の研究者が指摘してることで。
例えば網戸さんが100個繋がってる紐があるとします。
で、その100個の網戸さんをこうやって組んでいいよねっていうのを人間が考える。
人間が予測した場合に少なくとも10の47乗パターンは3次元構造を考えられるよねって言った人にね。
ある程度ランダムだと。
スピーカー 2
それは実際にそうなるかとかじゃなくて。
スピーカー 1
理論上はって感じ?
スピーカー 2
理論上は10の47乗。
スピーカー 1
この網戸さんとこの網戸さんは近づきやすいから近づいたとしたらこういう形取るよねとか。
そういうパターンが本当はめちゃくちゃ10の47乗みたいな。
これ計算しようとしたら宇宙の年齢より長い時間かかりますってよく言われるんだけど。
そんだけいっぱいあるのに普通に僕たちの体の中ってもう0.0000何秒とかで100個網戸さんつながってパッとその形になると。
これってなんか不思議じゃないっていうのを言った人いる?
スピーカー 2
そうだね。
スピーカー 1
まあでも実際実験的にはそうなるわけよ。
スピーカー 2
その人その疑問を呈した人は網戸さんの特定の配列になったらこういう形になるっていう。
そこはまあ認めてるけどでもその理由みたいなところを知りたかった感じ?
スピーカー 1
そう理由が知りたいしその時にさっきノーベル賞取ったって言った同じ網戸さん配列の並びだったら絶対同じ構造に折りたたまれるよねって言った人いるじゃん。
でもそれって計算してることと矛盾してるよねっていう指摘をしたの?
スピーカー 2
理論上は矛盾してるけど実際は実験結果としてはそう一つの形になっちゃうっていうところは認めてる?
スピーカー 1
だから本当はそうなんないやつもいるんじゃないのとか。
スピーカー 2
確かに。
スピーカー 1
実際確かめようないじゃん。
スピーカー 2
そうだよねもうタンパク質の数ってほぼ無限にあるぐらい。
スピーカー 1
タンパク質の数はもう無限にありますよ。
だって網戸さんが1個増えたらさ20種類パターンがあるわけじゃん。
20×20×20×ってなっていくわけじゃん。
スピーカー 2
そうだよね。
スピーカー 1
もう数えきれない数の種類発生しますやっぱり。
スピーカー 2
そうですね。
それ全部調べたわけじゃないもんね。
スピーカー 1
そうそうそう全部調べたわけじゃない。
だけどその順番が分かったら絶対こう折りたたまれるっていうのは本当にそう言えるんですかっていうパラドックスみたいな話よね。
っていうのに1970年代ぐらいからずっと人間って取り組んでるんですよ実は。
でそれって誰も分かんないわけよ。
だからひたすらタンパク質を頑張ってX性みたいな技術使って見えるようにしてっていうのをひたすら繰り返すしかないじゃん正直。
だって例数がいっぱいないと言い切れないわけなんで。
スピーカー 2
そうだね。
スピーカー 1
でもここからもう人間タンパク質の構造をひたすら調べるっていうのを永遠とやってきたわけなんですけど。
スピーカー 2
ちなみにそのノーベル賞を取ったアミノ酸の配列が分かれば構造一つに決まるっていうその結論を出した人は何個ぐらいのタンパク質だったりアミノ酸配列を実験してその結論に至ったのかな。
スピーカー 1
何個それめちゃめちゃむずいなちょっと待って。
スピーカー 2
なんか1個だけで育ったからといって全てがそうなると限らないじゃん。
スピーカー 1
そうね。
スピーカー 2
何個かやっぱ見たのかな。
タンパク質研究の歴史
スピーカー 1
この当時は1個ですね。
スピーカー 2
この当時は1個なんだ。1個調べられただけでもすごいみたいな感じなのかな。
スピーカー 1
これリボヌクレアーゼっていうもので、そもそも純粋なタンパク質を得ること自体も結構難しかったんじゃないかなと思うんだけど。
そのリボヌクレアーゼって酵素が1回変性って言ってさっき言ったような熱かけるとかやって元に戻してもちゃんと元通りの活性がありますよって。
だから1回引き伸ばしても必ず同じように折りたたまれるのでタンパク質ってそういうセンスがあるんじゃないですかっていう。
この後の時代で他のタンパク質もいっぱい調べられてやっぱりそうっぽいなってなっていったんじゃないかな。
最初にこの結論を出した人にノーベル賞あげようっていう感じの流れだと思うけどね。
スピーカー 2
なるほどね。
でその後にさっきの人がやっぱり違う可能性もあるんじゃないかみたいなパラドックスを提唱したんだね。
スピーカー 1
そうそうそう。
これを証明するためにはアミノ酸配列の並びさえあればこのタンパク質の構造になるよねっていう予測をしてそれが実際に調べたものと合ってましたっていうのが出ればいいわけじゃん。
材料をこういう順番でやったらこの料理できるよねっていうのを材料だけ見て予測しますみたいな。
そんな感じなんだけど。
っていうのが結構こう長年の夢なわけですね人間からすると。
これってもうコンピューター使えそうじゃん。
スピーカー 2
使えそうだけどもうアミノ酸の数も多いしそのなんか一個一個のアミノ酸とかの相互作用とか考えてたらめちゃくちゃ場合分けできそうだから大変そう計算が。
スピーカー 1
めちゃくちゃあるんですよ。
アミノ酸ってもう名前もそうだけどアミノって窒素Nの原子と酸ってカルボン酸っていうCO2Hっていうのがあるんだけどそれが一個の中でもどういう向きになってんのかなとかもある。
スピーカー 2
そっかそっかアミノ酸一つとってもあの時と場合によってはちょっと違う形にするからそういうのとかも全部考えてるとかなりの場合分けになっちゃうね。
スピーカー 1
そうそうそうなんですよだからもうバカ正直に計算するととてもじゃないけどできないみたいな。
とはいえ予測したいからそれをうまく予測するソフトを作った人に賞金あげますみたいなコンテストが開催されるようになるんですよ。
スピーカー 2
なるほどねなんかこの間のさあの若返りをさせるための研究を募集しますみたいなそういう感じのコンテストかな。
できたら賞金あげますよみたいな。
スピーカー 1
あれはさ結構基準難しいと思うんだけどこれすごいシンプルでアミノ酸の並びだけ与えて答えを教えないでおいて。
このコンテストってまだ世に発表されてないけどタンパク質の構図が分かりましたっていうやつを問題にするの。
スピーカー 2
なるほどね。
スピーカー 1
そうでみんなに予想させてで答えはこのタンパク質の形でしたって言って重ね合わせてどんだけ近かったのかっていうので競うっていう。
すごい分かりやすいよ答えがもうあるから。
分かりやすいね。
っていうコンテストがねこれ1994年からやられてて各年でやられてるのかなっていうのがあってみんなめっちゃ取り組むわけですよ。
どうやったらアミノ酸の並びからこうなんか規則性があるんじゃないかとか法則なんかあったら予測できるんじゃないかっていうのをずっとやってたわけよ。
でだいたい重ね合わせてそのスコアみたいなの出すんだけど40%とかそれぐらいが限界だったらしいんだよね。
それはいつまで?
これが2018年まで。
スピーカー 2
2018年までは40%だったのね。
スピーカー 1
なんかそんなもんでなかなかこうガンと予測値上がることないよねっていうのがずっと時代として続いてたと。
AIとタンパク質構造予測の進化
スピーカー 1
でそんな中2018年にいきなりゲーム業界みたいなとこからAIのすごい奴が参戦してくるっていうのはあるんだけどそれがさっき言ったディープマインドって会社なのよ。
スピーカー 2
俺たちがやってやるぜみたいな。俺たちもやりたいって。
スピーカー 1
そうそうそうこれすごい面白いんだけどスタートがディープマインドがその時に突然参戦してきたんだけどさっき言ったCEOデミスハサビスさんっていう人はこの人はチェスの達人なんですよね子供の時から。
スピーカー 2
その人自身が。
スピーカー 1
13歳でもうプロ級のチェスの人だったらしいんだけどそのチェス好きの人が10代にプログラミングにハマってプログラミングで成功してでAIを作ろうって言って出てきた会社がディープマインドって会社なのよ。
スピーカー 2
じゃあもう科学とは結構無縁な人?
スピーカー 1
生命科学とはそんなに関わってなくてだけどAIってもともと前回も話しましたけど脳の構造を模倣してるみたいなのあるじゃないですかニューラルネットワークって言ってた。
なんで神経科学とかは興味あってでそういう脳について勉強もしてたしだけど会社としてはめちゃくちゃ強いチェスのAI作ったり
それこそさっき言った作って世界チャンピオンと戦わせてみたりっていうのをやってた会社なんだけどでそれをグーグルが面白いって言って2014年に買ったと。
でグーグルから出資受けてディープマインドはさらにもっといいAIを作ろうっていうのでどんどん言ったらAIの機能をどんどん強化していった。
スピーカー 2
より頭のいいAI作ろうとしてたらしいよね。
スピーカー 1
でじゃあこのめちゃくちゃ頭良くなってきたAIにアミノ酸の構造を学ばせてその構造からタンパク質を予測するっていう風に使ったらこれ大会優勝できるんじゃないかみたいな。
スピーカー 2
いやもうそのさ頭いいAIは他の分野で使われててでそれをその別の分野であるタンパク質の構造解析に使ってみたみたいな感じなんだな。
スピーカー 1
目的はだからより良いAIを作ろうででその過程でEGOにやらせてみたりとかいろいろやってたんだけど。
スピーカー 2
同じAIが使われてる?
スピーカー 1
全く一緒じゃないけど。
スピーカー 2
なんかタンパク質構造解析用のAIとかを新しく作ったのかなとか思ってたけど。
スピーカー 1
それはね作ってる。
基盤のシステムは一緒で何かを学習させてでEGOだったらさいろんな局面を見せてこの局面だったら次の一手はここに石を置くのがいいって予測じゃないですか。
勉強させるのがEGOじゃなくてタンパク質の構造にしてこのアミノ酸だったらこういう相互作用がありそうなんでこういう形っていう学習をさせたっていう。
だからタンパク質用のAIですよね。
でこれはアルファフォールドっていう名前のやつが最初にできて。
スピーカー 2
みんなアルファなんだ。
スピーカー 1
アルファなんちゃら。
スピーカー 2
アルファEGOとかね。
スピーカー 1
でやってみると今まで40%くらいかなって言ってた予測率がいきなり60%くらいが出る。
でも優勝するわけですよ大会。
スピーカー 2
でも60%で優勝なんだ。
90%くらいいくのかなって思った。
スピーカー 1
この時はまだ60%くらい。
だって1994年から始まって2017年までやってて40%くらいだったねずっと。
スピーカー 2
そのコンテストいつ終わるんだって感じだけどね。
スピーカー 1
ずっと開催してるかな。
1年で20%上がったわけですよ。
スピーカー 2
それはすごいね。
スピーカー 1
そしたらおおーってなるじゃん。
スピーカー 2
なる。
スピーカー 1
だけどいやでもやっぱこうもっと上げないと使えないよねっていうのはなってたんだ。
で結構頑張ってたらしいよその後もアルファフォールドってやつ頑張って改良してもっと90%くらい出したいってやってたんだけどあんまうまくいかなかったらしくてその時は。
スピーカー 2
2018年くらい。
スピーカー 1
そしたらそこに今回のもう一人の受賞者のジョンジャンパーっていうスーパー新人が入ってくる。
スピーカー 2
新人なんだ。
何歳くらい?
スピーカー 1
この人、てかね今回受賞者みんな若いはずなんだけど。
スピーカー 2
若そうだよねなんかAIの人って。
スピーカー 1
39歳かな。
スピーカー 2
すごいね。受賞した今が39歳ってことは入社したのがいつか知らんけどもうちょっと若かったんだよね。
スピーカー 1
2000年代くらいにマスター取ってんのかな。
で2011年から研究員として働いててD賞ってめっちゃ有名な人いるんだけどその人のところで働いてて2014年にディープマインドに入ったと。
スピーカー 2
なるほどね10年前。
スピーカー 1
入ったのはもうちょっと早かったのかな。
でこの人はスーパーコンピューターとかめっちゃ勉強してた人で理論物理学で博士とってんのかな。
なんだけどタンパク質の問題についても聞いたことあって物理学の知識が生命とかそっちに使えるんだっていうのはすごい興味を持ってたと。
元々別な会社で働いてたんだけどなんかディープマインドっていう会社がタンパク質構造の予測みたいなのをやってるらしいっていう噂を聞いたと。
でこのジョンさんはめっちゃ面白そうって思って求人で応募して採用されて俺はタンパク質を予測するためのいいアイデア持ってるぞっていうので入ったと。
スピーカー 2
じゃあその当時はスーパーコンピューターの勉強とかはしててかつ物理の知識があるけどAIの知識もあったのかな。
スピーカー 1
そうAIの知識もある。
スピーカー 2
じゃあもう最適な人材ですね。
スピーカー 1
そうもうめちゃくちゃマッチしてる人がディープマインドに入社してでそこでこのアルファフォールドを改良するぞっていう風になったらしいよね。
ここが結構根本から変えたらしくってアルファフォールド自体もすごかったんだけど
計算する前言ったニューラルネットワークっていうものを方法自体を変えたみたいな。
これトランスフォーマーって言うんだけどチャットGPTのTなんですけどこれだけでめちゃくちゃ細かいんで詳しくはチャットGPTの話をすごい深掘りしてるサイエンマニアってポッドキャストがあるんでそっち聞いてもらったらめっちゃ分かるんですけど。
スピーカー 2
じゃあ詳しくはサイエンマニアを聞いてくださいっていうことですね。
スピーカー 1
そうね要は膨大な数のデータを読み込ませてそこから特徴量みたいな言うんだけどパターンを抽出してくると。
タンパク質の場合だとアミノ酸の角度の情報とかそういうものをパターン化してでAID予測させるためにはこのパターンだとこうっていうのをすごい効率よく見つけてくるシステムみたいな。
まじざっくり言うとねトランスフォーマーっていうニューラルネットワークの名前なんだけどそれをアルファフォールドに導入すればもっとパワーアップするよっていう提案をしたと。
スピーカー 2
今まではそのトランスフォーマーはなかったんだ。
それを新しく導入しましょうってなったんだね。
スピーカー 1
それを導入するっていうのをやってそういうトランスフォーマーっていうものを使ってアルファフォールドをアルファフォールド2っていうのにバージョンアップさせてそれが90%以上予測できるようになったと。
だからもうほぼ実験と誤差ないよねぐらいのレベルにもうそれでバーンってなってる。
これ2020年で。
スピーカー 2
2020年。
AlphaFoldの革新
スピーカー 2
じゃあやっぱりそのトランスフォーマーが考慮してた要素、アミノさんの角度とかそういうのがすごく構造決定に重要だったっていうことなのかな。
スピーカー 1
そうそうそう。
スピーカー 2
逆にそれまでは何を見てたんだ?
スピーカー 1
それまではアミノさんの距離みたいな情報を結構メインで応用したのかな。
スピーカー 2
距離、アミノさんとアミノさんの間の距離みたいな。
スピーカー 1
でその距離を情報として距離とあと角度を学習して予測するっていう方法が取られてたのが元々のアルファフォールド1か。
で2になるとトランスフォーマーを使うことによってその場所の情報がまず予測として出てくるわけですけど、
それに対して今まで知られていたタンパク質、その今予測したい部分と似てるタンパク質の構造っていうのがあったりすると。
でそれと似てるかなっていうので、例えばここが螺旋状っぽい形になっている今まで知られているタンパク質あるなっていうのが確認できたらそれに近しい予測をするとか。
スピーカー 2
じゃあ最終的な形からもともとの、あれでも最終的な形を予測してでもともとのアルファフォールド。
スピーカー 1
で1回予測するわけじゃん、位置関係を。
スピーカー 2
予測してでまた戻ってくるの?
タンパク質構造の予測とトランスフォーマー
スピーカー 1
1回昔学習したことがあるタンパク質の部分の構造のここと似てるなみたいな比較できるわけじゃん。
ここちょっと違うなっていうのを修正してでもう1回また予測するっていうのをめちゃくちゃ繰り返すっていう。
スピーカー 2
あーなるほどね、バージョンアップさせていく。
スピーカー 1
だからちょっとずつ正解に近づいていくみたいなイメージ、そういう感じかな。
スピーカー 2
なるほど、それがトランスフォーマーがする新しいこと?これまではしてなかったけど。
スピーカー 1
そうそうこれまではできてなかったけど、トランスフォーマーはそういう特徴を出してで出た結果がこういう別角度から見たらここおかしいよねみたいな。
そことの比較の情報も入れて更新してでまた計算して更新してっていうのを繰り返すみたいな。
スピーカー 2
なるほどね。
スピーカー 1
チャットGPTも多分そんな感じで。
スピーカー 2
確かに。
スピーカー 1
例えば私っていう文字があった時にその次に来るのは私はなのか私がなのかっていうのをまず出してで私はってなったからってことは次こういうのが来るかなってまた次こういうのが来るのかなっていうのをやってるのがトランスフォーマーで。
それと同じような感じですよねやってることとしては。
スピーカー 2
なるほど、繰り返しながら正解に近づいていくっていうことをやったんだね。
スピーカー 1
でもうそれが行き着く先が答えですみたいな感じだから。
っていうのがざっくりとトランスフォーマーがやってることかなこれ。
ノーベル賞受賞者と新技術
スピーカー 2
なるほど。
でさあその90%以上が出たっていうのは何個ものタンパク質でそれが証明された証明されたというか何個ものタンパク質で予測した時にも全て90%以上になるっていうのを確認したんだよね。
スピーカー 1
そう大会では特定のタンパク質まだ未発表のタンパク質でやって90%以上って結果出してるんだけどその後ももちろん今まで知られてるやつやってもやっぱり90%以上で出るぞっていうのが確認されて。
もうね実験でやる誤差と同じぐらいしか誤差出ないよねってなって。
スピーカー 2
いやまあでもなんか技術の発展って急にずどってずどじゃない急にぴょんってできるようになるイメージが。
スピーカー 1
どっちでもいいけど別にずどっとでもぴょんとでも。
スピーカー 2
いやずどって言ったらなんか落ちる感じがするから。
スピーカー 1
ああそう。
そのぐらいぴょんってジャンプしたわけですね。
スピーカー 2
でさあこれができるようになってじゃあ今後どういう応用が考えられるのかな。
スピーカー 1
そこなんですよね。
次これができるってことはさつまりアミノ酸配列があるとこういうタンパク質になるよねっていう存在しないやつも予測できるようになっていく。
スピーカー 2
人工タンパク質とかも作れそうでこういう形にしたいからみたいな。
スピーカー 1
そう実はそれが3人目のノーベル賞受賞者がやろうとしていることで。
スピーカー 2
あれジョン・ジャンパーさんが3人目だと思ってた。
スピーカー 1
最初紹介したのはジョン・ジャンパーさん2名だったんだけど最初に言った教授ちょっとまだ出てきてないんですけど。
教授は実はこの人たちとはまたちょっと独立して研究してて。
この人がやばいのはこう人工タンパク質作ろうっていう人なんよねさっき言ってたように。
スピーカー 2
自然界に存在しないタンパク質を作ってすごく綺麗に折りたたまれるタンパク質を設計するっていう研究者だった。
スピーカー 1
これ2003年とかにもうできてるんだけど。
これはねちょっと音じゃ伝えられないんだけどすっごい綺麗にサッカーボールみたいに折りたたまれるタンパク質とか。
そういうのを自力でというかコンピューターを使ったりはしてるんだけどそういうソフトウェアを作った人で。
スピーカー 2
それもAI関係してる?
スピーカー 1
いやこれはね最初はAIじゃない。
スピーカー 2
最初は。
スピーカー 1
途中でAIを取り入れ始めるこの人も。
この人もAIでタンパク質の構造を予測したいなっていうのをずっとやっててさっきの2人と同じような感じで。
で同じような結論にたどり着くんですよ。
やっぱりAI使ったらそれできるぞっていう。
でそのさっき言ったアルファウォールド2みたいなAIを自分たちが使ってるソフトにも導入して。
これをやれば今まで誰も作ってないタンパク質の構造の予測にも使えるぞっていうのをバンバン論文出して。
スピーカー 2
でもそれはもう当たり前だよね。
だって今まで誰も知らないアミノ酸配列がどういうタンパク質の構造になるのかっていうのはアルファウォールド2を使ったらもう構造がわかりますよっていうことはもうわかってるよね。
スピーカー 1
この人はこのAIのやつができる前からタンパク質の構造とか予測するシステムみたいなものを積極的に公開してたと世界中に。
スピーカー 2
教授?
スピーカー 1
その教授。でAIでもできるぞってなってそのAIの予測できるやつもこう一般に公開するぞって言って公開したわけですね。
でそれがあったんでアルファウォールド2もこれはもう公開しなきゃってなって。
スピーカー 2
はいはいはい。
スピーカー 1
ほぼ同時に公開したと。
スピーカー 2
精度はさすがにアルファウォールド2の方がいいんだよね。教授のより。
スピーカー 1
いや教授のやつも同じくらい予測できる。
スピーカー 2
あ、そうなんだ。へー。
スピーカー 1
なぜかというとトランスフォーマー使うって言ってたじゃん。
トランスフォーマーは元からある技術なんでそれを自分のロゼッタってやつなんだけど自分のソフトにトランスフォーマー使ったらめちゃくちゃすごいっていうのをアルファウォールド2やってるしできんじゃないかっていう。
そしたらやっぱり実際できると。
スピーカー 2
じゃあアルファウォールド2の後だったんだね。
スピーカー 1
アルファウォールド2の後。でアルファウォールド2その時公開してなかったんだよね。
スピーカー 2
公開してないけど自分のソフトに入れることはできるの?
スピーカー 1
入れるというかアルファウォールド2を入れたんじゃなくてアルファウォールド2で使ってるトランスフォーマーっていう仕組みを。
応用可能性と未来の展望
スピーカー 2
それを公開したんだ。
スピーカー 1
トランスフォーマーっていう仕組みを使って自分たちも作ってそれを公開した。
スピーカー 2
あーそうなんだ。
スピーカー 1
ってなったらさみんなさそれ使っちゃうじゃん。
それって?
みんなさこの教授が作ったやつを使いたくなるわけじゃん。
スピーカー 2
あ、ロゼッタ。
スピーカー 1
ってなったらアルファウォールド2も公開するかってなるわけじゃん。
見たのがあったらしいですよ。
なるほどね。
で誰もがアクセスできるようにした方が人類のためだよねっていうので。
でどっちも公開されたらしい。
でそこからみんな使えるようになってこのノーベル賞の功績としてはこういうすごい家を作ったんだけど別に独占とかもしないで
もうオープンにして誰でも使えるような形にしたっていうのが結構言われてて。
スピーカー 2
そうだね。
スピーカー 1
功績として。
スピーカー 2
素晴らしいね。
スピーカー 1
でも今いろんな論文にこれ使われてるんですよ実際。
190カ国200万人以上が使用してると言われてるアルファウォールド2に関しては。
スピーカー 2
あのささっきの質問に戻るけどさこれをどういうふうに使うかっていうところはアルファウォールド2だったりそのロゼッタだったり
タンパク質の構造を予想するっていうソフトはできたわけだけど実際にどういう場面で使われるの?
スピーカー 1
タンパク質が予測できると例えば何か薬が効いてるとするじゃん。
タンパク質に何か薬が効いてるんだけどどこにくっついてるか分かんないっていうのがあったとして。
スピーカー 2
薬が?
スピーカー 1
そう形が分かるとここにはまってるんだっていう予想ができる。
ってなったらそれをもっと例えば改良してもっとこのポケットにはまりやすくするにはどうすればいいのかって考えられたりもするし。
あとは今タンパク質とタンパク質がどうくっつくかの予想にもこれ使えて。
スピーカー 2
形が分かるからなんか凹凸みたいなわからないけどそういうのが分かってあこことここくっつくかもねみたいなそういう予想ができるっていうことかな。
スピーカー 1
それが分かるとこのタンパク質とこのタンパク質がくっつくっていうことが例えば病気の人はタンパク質に変わった変異の部分があるからくっつかなくなっちゃって病気になってるんだとかそういうのが予測できたりする。
スピーカー 2
病気のメカニズムとかにもメカニズムの解析にも使えるんだ。
スピーカー 1
使えるとかあとタンパク質自体が光ったりもするんだけど配列によってはね。
だからそれをちょっと改良してもっと光らせるにはどうしようかなっていう設計とかもできたりするらしい。
とか。
スピーカー 2
そっかそっか。
スピーカー 1
いくらでもあるね。
スピーカー 2
とかなんかこういう形にしたいですみたいなその目標の形があったときにじゃあ逆にどういうふうな網の3配列にしたらいいのかなみたいなそういうことにも使えるかな。
さっきもちらっと言ったけど。
スピーカー 1
逆向きのっていう。
それもできるっていう感じでなんか応用は多分これいくらでも多分あるんですよ。
で今もうアルファフォールド2がさらに改良されてアルファフォールド3っていうのも出てるんですけど。
3はタンパク質が3つとか4つとかあってもどう組み合わさるかみたいなの計算までできるとか。
スピーカー 2
2までは網の3配列から1つのタンパク質までだったけど3ではタンパク質かけるタンパク質の相互作用みたいなところまで予想できる。
スピーカー 1
そうできるし何ならDNAとかRNAとかにも入力できるようになってる。
スピーカー 2
DNAとかRNAに使えるっていうのは具体的にそのどういうふうに使えるの。
スピーカー 1
例えばだからDNAにくっつくって言われてるタンパク質があったとして、
じゃあ実際どういう形でくっついてるんだろうとか。
スピーカー 2
なるほどね。
スピーカー 1
それももしわかったらね。
じゃあそれを例えばブロックしてやるような分子はどうやったら設計できるかなとか考えられたりするわけじゃない。見えたら。
スピーカー 2
確かに。
スピーカー 1
目に見えるってだからすごいんですよね。
スピーカー 2
それこそさこの間話してた老化はDNAに関係あるって言ってたからさ老化させるような分子とDNAの繋がりだったり
そういうのをどうやって疎外するかみたいなことを考えるのに使えたりもできたりするのかな。
スピーカー 1
できると思う。
自分の体の中の相互作用とか分子の動きも見えるようになるし、
スピーカー 2
外から使うツールとしてのタンパク質も思い通りに設計できるようになったというか。
すごいね。
っていうのが今までだってよく言われるのが1個のタンパク質の構造を決めたら収支過程とか博士過程とか取れるとかそれぐらい年数も時間もかかるようなもんだったね。
スピーカー 1
実際僕の知り合いもいますしこのタンパク質の構造を解析したから博士取れましたとか。
スピーカー 2
私の周りでもいたかも。
スピーカー 1
いるんだけどもちろんそれも実験的にちゃんと確認できるってものすごいことでまたこのAIの話は別なんだけど
だけど予測でもそういう本当は労力も年月もかかるものが数分でできるようになってるっていう。
って考えると相当すごいんですよねこれ。
スピーカー 2
すごいね。
スピーカー 1
これからの技術ではあるんだけどノーベル賞出てさらに注目をされてっていうAIの研究でした。
スピーカー 2
あれじゃあ最初の方に言ってた本当にアミノ酸配列決まったらタンパク質の構造決まるんかみたいな疑問を投げかけてた人のその疑問に対してはそれはもうイエスですよっていう答えでいいのかな。
スピーカー 1
これはねイエスですね。
スピーカー 2
正直さ本当に例外的なものがないのかって言われたらわかんないかもしんないけど無限にあるからね。
スピーカー 1
だけどこんだけいっぱい何万とかですよ。
種類のタンパク質とかをやっぱやってみると構造やっぱ特定のアミノ酸だったら決まってるし。
今までの例ではもう全部一つのアミノ酸が決まれば構造も決まっちゃうっていうそうなってるから多分そうだろうっていうことか。
もちろん動いたりはするんだけどね。
スピーカー 2
ちょこちょこ動いたり。
タンパク質構造予測の歴史
スピーカー 1
タンパク質って柔らかいんでAという形とBという形を行ったり来たりしてますみたいなパターンのタンパク質ももちろんあるんだけど。
それもちゃんとアミノ酸配置が決まってれば決まるっていう。
スピーカー 2
なるほどね。
スピーカー 1
だから1900最初50年ぐらいですか初めてタンパク質見えたぞっていうところから70年ぐらいかかってやっとここまでたどり着いたっていう感じですね。
スピーカー 2
すごいねでも。
スピーカー 1
でも70年で。
スピーカー 2
70年はかかったけどさでもこんなAIのソフトができちゃったからこれから一気になんだろうなんかタンパク質の構造が関係するような研究が一気に加速しそうだね。
スピーカー 1
もうね実際してますよ。
してる?
数えきれないぐらい論文出てる。
スピーカー 2
じゃあもうなんかタンパク質の構造の研究者たちにとってはもうショックみたいな感じかな。
スピーカー 1
いやショックな人がいるかもしれないけど。
ショックはショックだと思いますよ。
スピーカー 2
研究の分野に大きな影響を与えてるってことだよね。
スピーカー 1
そうだよ。
さっきの補足すると一応これまでに人間が発見してたタンパク質って2億個ぐらいあるらしくて。
ほとんど全ての構造をもうこれ予測してると。
いうことみたい。
スピーカー 2
すごいね。
スピーカー 1
だから100%ではないけど限りなく100%に近いぐらいまで来てますよってことだよね。
素晴らしい。
っていうのとあとはこれからこれ当たり前だよねっていう時代になっていくと思うんだけど。
そうなる前にちゃんとノーベル賞を受賞されてめでたしめでたしっていう感じもする。
スピーカー 2
そうだね。よかったちゃんと功績としてね一つ出てきて。
研究の影響と投票のお願い
スピーカー 1
今回の話はもうめちゃくちゃ簡単に言ってます。
細かいところいっぱいあるんですけどもちろん。
予測モデルの話とかね。
ちょっとなんか違う伝わり方しちゃってたらあれなんですけど。
そういう人がいたら是非補足とかあったらね。
またお便りなりコメントなりでしてもらえると非常にありがたいです。
スピーカー 2
言葉だけで伝えるのは結構難しいと思うけど。
もし専門家の方がいらっしゃってここはもっとこうした方がこう説明した方がいいよとかあったら連絡くれたら嬉しいですよね。
そしたらみんなで勉強できるし。
スピーカー 1
そうですね是非お願いします。
スピーカー 2
はいお願いします。
スピーカー 1
はいというわけで今回はこんな感じでした。
で最後にポッドキャストアワードの投票。
皆さん結構投票しましたっていうコメントをたくさんいただきました。
ありがとうございます。
スピーカー 2
ありがとうございます。
スピーカー 1
とはいえ本当にこれ聞いてる人皆さん投票してくれないと多分無理です。
スピーカー 2
はい。
スピーカー 1
結構ねもうわかんないんだけど本当に全員投票しないと無理だと思う。
スピーカー 2
そうだよねだって芸能人と戦うんでしょ。
スピーカー 1
芸能人と戦ってる僕たちは。
スピーカー 2
そうだね。
私も投票した方がいい。
スピーカー 1
君も1票持ってるんで1票投票しててください。
スピーカー 2
投票しとくわ。
絵ママにもお願いしとくわ。
スピーカー 1
絵ママにもお願いしといてください。
説明欄のとこにURLがありますんでそこを開いてまじ1分もかかんない。
スピーカー 2
1分かかんない。
スピーカー 1
サイエントークって言ってメールアドレス入れて何故か年齢書くとこがあるんですけどそれ入れてピッてやったら終わりです。
今これを聞いている皆さんぜひ押してサイエントークピッて投票してもらえたら非常にありがたいです。
スピーカー 2
今までねこういう賞取ったことないからこそ1回を取ってみたいみたいな気持ちがありますもんね。
スピーカー 1
そう僕たちをトランスフォームさせてください。
スピーカー 2
あなたの1票がトランスフォーマーになりますよってことですね。
スピーカー 1
なります。
あなたはトランスフォーマーになれます。
スピーカー 2
どうぞ。
スピーカー 1
よくわかんないけど。
スピーカー 2
はい終わります。
スピーカー 1
ありがとうございました。
スピーカー 2
ありがとうございます。
43:16

コメント

スクロール