2023-04-29 06:44

オライリーの生成AI本

● 画面付きの動画はこちら https://youtu.be/FeOhXSPZbYw ● 「Generative Deep Learning, 2nd Edition」 https://learning.oreilly.com/library/view/generative-deep-learning/9781098134174/

● 「Generative Deep Learning」 https://learning.oreilly.com/library/view/generative-deep-learning/9781492041931/

● 「全エンジニアが使うべき!「オライリーサブスク」を全力で紹介!」 https://zenn.dev/mossan_hoshi/articles/20230128_oreilly_learning

● 「【図解】ストーリーでわかる!ソフトウェアアーキテクチャ13選」 https://zenn.dev/mossan_hoshi/books/b2326637fec195

●【Twitter @mossan_hoshi】 https://twitter.com/mossan_hoshi
●【Youtube @mossanhoshi7158】 https://www.youtube.com/@mossanhoshi7158
●【Zenn @mossan_hoshi】 https://zenn.dev/mossan_hoshi
●【Qiita @mossan_hoshi】 https://qiita.com/mossan_hoshi


書籍紹介, 生成AI, ChatGPT, OpenAI, GAN, 拡散モデル, VAE, 読書, 読書, 本, オライリー

深層学習についての基礎
こんにちはMOSさんです。今回は、最近あんまりやってませんでしたが、気になる本を紹介する短い動画をやってみたいと思います。
直前に投稿した動画で、本読まなくなったよって言いときながらいきなりなんだよって感じなんですが、
その動画作ってる途中で、改めて最近どういう本が出てるのかなって見てみると、これはちょっと注目だなっていう本があったので、紹介したいと思います。
で、先ほど言った前回投稿した動画がチャットGPTのせいで本読まなくなったよっていう話ですが、今回もある意味チャットGPTとかの生成合い絡みの本になります。
タイトルがGenerative Deep Learning 2nd Editionというものになっています。タイトルからわかる通り第2版です。
この第2版が今年2023年の5月にリリースとなっていますが、
表紙見る限りはアーリアクセスの文字が消えているので、中身としては完成しているとみなして良いかと思います。
この最新の第2版に対して、第1版の方は2019年に出ています。
この2019年の頃は、まだトランスフォーマーが出てくる前なのかな。少なくともこの本では代々的には扱っていません。
なので主にオートエンドコーダーとかギャンといった、今となってはちょっと古いかなという生成系の技術について語られています。
この2019年から4年ほど経って、この生成系AIの進化がえげつないことになっているので、そこら辺のアップデートをしたのが今回リリースされた第2版という形になっています。
書籍の構成なのですが、主に3パートで絡まっていて、第1パートが本当初心者向けの、そもそもディープランニングって何ぞやっていう話が書かれています。
ここら辺は他の本で読んだ方がわかりやすいかと思います。そもそもこういう本読む人はここら辺わかってたろうっていう話なんで、あまり読む必要はないかなと思います。
生成AIに関する技術
第2版、パート2がこの生成AIを支える屋台骨となる技術、先ほどはオートエンコーダーとかギャンとか言いましたが、そこら辺の技術ですね。
先ほどはそのギャンあたりで止まっていたのが、このディフュージョンモデルも含めて説明がされています。
この第2部、まだ私も読んでないんで、細かいところは言えないんですけども、パッと眺めてみて、すごく面白かったなと思ったのが、
各章でそれぞれの技術について説明するんですけども、その時にちょっとした小話というか物語を挟んで、この技術ってこういう雰囲気だよっていうのをですね、説明してあげる。
さらにはですね、その物語に応じた絵を提示してあげているわけですね。
これどういうことかというと、私以前にソフトウェアアーキテクチャーをわかりやすく学ぶための動人誌を作りまして、
これの作り方がまさに同じだなと思っていて、具体的にどういうことかというと、
学びたいトピックがあった時に、まずそれを何らかのメタファーで表します。
例えばこの場合だと、モノリシックアーキテクチャーを堅牢な、ただしやや崩れつつあるような、
でかい城みたいな感じでですね、例えて、それでこのモノリシックアーキテクチャーの特徴やデメリットみたいなところを、
そのストーリーを通して説明するという本を書きました。
この場合、この技術をどういうふうに例えるがいいみたいなのも、
チャットGPTに聞きますし、さらにはですね、その例えた上でのストーリー作り、それもチャットGPTにお願いしてストーリーのテキストを出させます。
さらにそのできたストーリーを表すような絵をMid Journeyに書いてもらうことによって、
もう生成AIだけ使ってこの技術のイメージをつかむことができるわけです。
技術書籍の構成
この第2部のところではまさにそれをやっていて、書く章ごとにこの技術がどういうイメージなのか、
さらにはそれを表すMid Journeyで書かせた絵ってのが載ってて、
それでイメージをつかんだ上で技術的な説明に入っていくっていう流れが、
このAutoEncoderからDiffusionモデルの3章から8章のところで全部なされています。
なので第一版に比べてもかなり読みやすくなっているんじゃないかなというところが期待されます。
最後のパートであるアプリケーションのパートでは、
注目ポイントとしては第9章のTransformerと書かれているところで、
ここは具体的にはChatGPTなどのいわゆるGPTモデルと呼ばれているものが、
どういうような形でトレーニングを受けているのかというところを技術的に解説しています。
このChatGPTのGPTって何かってなかなか説明できる人少ないかと思うんですけれども、
まさにそこがわかるようになるっていうイメージです。
ちなみに一般的なGPTの訓練方法の説明に加えて、
この正末の方ではChatGPTでは具体的にどういうフローで学習をさせているのかという説明も書かれています。
このGPTの説明以外にもGANでもいろいろ進化してますんで、
いろんなタイプのVIT系のやつも含めて様々なGANの紹介であったりだとか、
あとはその音楽の生成でどういう風な形で生成させているのだとか、
あとはもう一番最後のこのマルチモーダルモデルの章なども結構注目かと思います。
そんなわけで、結構生成AIというワードはトレンドで、
断片的に情報はいろいろ入ってくるかと思うんですけれども、
そこら辺を網羅的にまとめて学習できるという意味でかなり注目の本じゃないかなと思います。
私もゴールデンウィーク中にがっつり読んでみたいなと思っています。
で、このGenerative Deep Learning 2nd Edition読む方法ですが、
ちゃんと調べてないんだけども、多分直近ではオライリーのサブスクリプションに契約する必要があるかと思います。
もうちょっとすればAmazonとかでも読めるのかなとは思いますけれども、
ちなみにオライリーサブスクの契約方法とか、そもそも使い方、
あと英語読めないけど大丈夫?みたいなところですね。
そういった情報に関しては、以前にこのオライリーのサブスクを全押しする記事を作ってますので、
こちらの方を参考にしていただけると、雰囲気が分かるかなと思います。
以上、書籍の紹介でした。
06:44

コメント

スクロール