1. terapyon channel
  2. #82 小山さんwhitphxさんをゲ..
2023-08-24 2:00:39

#82 小山さんwhitphxさんをゲストに OSSを仕事にをキーワードにHugging Faceや周辺のPython UIフレームワークについて語る

Guest:

小山さん tkoyam010

科学技術計算の受託解析と受託開発をする企業に所属しています。プライベートでPyVistaという可視化ライブラリのメンテナをしています。今まで作者におんぶにだっこでしたが、作者2人が活動に時間をさけなくなってきたため忙しくなってきました。


橘祐一郎さん。SNSはwhitphxでやっています https://twitter.com/whitphx⁠

ここ2年くらいStreamlitというpure-Python Web UI frameworkのOSSコミュニティによくいます。コア開発者ではなく、Streamlitの拡張を書いたり、issueや小さいPRを送ったりしています。最初は余暇で無給の趣味としてやっていましたが、半年前からHugging Faceで職を得ました。


Note:

  • 82回Podcastスタート。小山さん、whitphxさんの紹介
  • 今回の対談企画は、OSSと仕事の関係の話
  • Hugging FaceやLLMの話を先にしましょう。Hugging Faceはそもそも何?
  • Hugging Faceは、会社(組織)、 サービス https://huggingface.co/ 、ライブラリ https://pypi.org/project/transformers/ などがある
  • huggingface.co の Spaces がデプロイサービスで便利で使いやすい。Gradio / Streamlit が標準でサポートされているので、Pythonだったら簡単に使える
  • Transformersは自然言語処理のフレームワークですごく便利
  • LLMなどのモデルによっては、ネットワーク越しにデータを渡しているものがあるから企業内のデータを使う場合は注意が必要ですね。
  • Spacesの使い所や便利さを再確認。WebでUIを簡単にホストしてくれる。
  • Spacesで、GPUを使うこともできる。課金が必要なんですが。
  • 学習するときのGPUはどのようなものを使っているのか? ローカル/クラウド? 16GB VRAM??
  • LLMの世界は、営利企業やそれなりの組織じゃないと手が出せない? ファインチューニングはできるか?
  • LLMもモデルの大きさはどう選ぶ?
  • GradioのはHugging Faceでメンテナンスされている。Panelとの違いは? Streamlitと同じレイヤー
  • Python UIフレームワークは他にも、Shiny for Python, Solara, Plotly Dash, Reflex, Reacton, ReactPyとか
  • PyVistaはtrameを使っている
  • Ruby on Railsかは始まったと思われる、軽量Webフレームワークの群雄割拠な時代を少し振り返る
  • Streamlitとか、Tornadoバックエンドが多い。Gradioなど比較的新しいものはFastAPIが使われている
  • PyQtとかGUIツールよりもWebの世界になっている?
  • StreamlitのWasm版をwhitphxさんが作っていいる話
  • whitphxさんが9月のPyCon TW、10月のPyCon APAC in JapanでStreamlitのWasm版のトークをする
  • GradioのWasm版は、Hugging Faceの立場でOSSに関わって作っている
  • OSSでメシを食う話(今回のメイントピック)
  • ピュアにOSSだけでメシを食っているっていう人はどのくらいいるのか?寄付ベースかな?
  • OSSプロジェクトに関係すると成長が実感できる。趣味を超えて仕事と関連したい。
  • 小山さんはフリータイムの100%をPyVistaにコミットしている
  • Sphinxはリリースマネージャーがイギリスの方に変わって開発スタイルが大きく変化。さらに一人の腕力で開発がめっちゃ進んでいる。
  • PyVistaのPR承認後、マージまで24時間待つルールは面白い。
  • WebアプリのUI/UXをどうするか? whitphxさんは「インタフェースデザインのお約束」で勉強したが。
  • StreamlitとGradioのフレームワーク設計の違いについて。状態変更で再実行 vs コールバック関数を一つだけ渡す
  • Panelやについても少しだけ。
  • Plotly Dashに比べると、Streamlitのパフォーマンスは気になる??書きやすさとかコード量の違いがある。
  • Hugging Face SpacesのGitの機能と開発スタイルを寺田が聞く。開発はGitHubでやる方がスタイルに合うかな。
  • 海外カンファレンス登壇のモチベーションについて、3人で確認し合う
  • PyCon USのスペイン語トラックを他で、別言語で出来ないかな?
  • 収録が2時間になってしまうのでこの辺で終了。


関連リンク:


02:00:39

コメント

スクロール