Guest:
ky(さん)と呼んでください!Python大好き、Webサービス大好き、自然言語処理も大好きなエンジニアです。ぜひTwitter(@hirokiky)でフォローしてください!株式会社ゼンプロダクツというスタートアップの代表取締役です。Shodoという、日本語をAIが校正してくれるWebサービスを開発・運営しています。オンライン上でMarkdownの執筆・レビューができるサービスですので、テックブログの運営にもおすすめです。DjangoCongress JPというカンファレンスも毎年主催しています。
Contents:
スタート
ゲスト hirokikyさんの紹介
2022年2月に自然言語やAIの話をしている振り返り。GPT-4の話もしていた
kyさんの自己紹介
terapyonの興味範囲。APIを使うより中身を勉強したい。
GPT-4はオープンソースでない寂しさがある
いまの自然言語系AI開発は飛行機ビジネスみたいにお金がかかるけど、ファインチューニングとかでオリジナルなものが作れる魅力はある
terapyonがOpen AIのWhisperで文字起こしをやっていてチューニングに挑戦中。モチベーションについて
AI系の技術スタックの理解が一つづつ難しい。huggingface, Datasets, DataLoader, transformers, PyTorch, PyTorch Lightning
pyhackなどのコミュニティや勉強会に助けられてきたので、MLの活用形のコミュニティはあるかな?
研究ではないMLエンジニアリングや運用といったことのノウハウ共有があると良い
Shodo.inkにChat-GPTの導入は面白いアイデアだと思った
AI生成やChat-GPT関連のライセンスや著作権問題は考えていきたいし、倫理的な問題になるかも
AIって最後は倫理問題かな
AIで鬱にならないで欲しい話、エンジニアリングとかまだまだ価値がある
詰め込み教育的な答えを出すのはChat-GPTのほうがすごいと思う
意外と自我っていうのは人間の物質的なものがあるかも話
Chat-GPTなのかWhisper触ってる場合じゃないのか?
1年前の時にスタジオを作って動画活用って言った振り返り
terapyonは本の紹介とかをプログラミング技術の動画講義を作りたい
一般社団法人PyCon JP Associationの理事にインタビューをリモートでやって動画にまとめた話 https://youtu.be/gr9t-P9CrsM
動画編集に文字起こしツールWhisperが大活躍した話
寺田が年齢関係なくガツガツやっているのを、他の人も真似しないかな?
Podcast収録したらまたやる気ができたのでもうちょっと勉強してみる
研究は面白いが、成果がでないこともあるので大変でもある。
AI系の学習タスクは、手元でやるか?クラウドでやるか? VRAM 8GB/12GB or クラウド
Whisperをインテル系CPUで動かすととてつもない時間がかかるが、Appleシリコンならそれなりに早い
WhisperをプロダクションでAWSで動かしたいときはkyさんが相談に乗ってくれる