1. fukabori.fm
  2. 124. AI時代のGPUクラスタ、DC..
2024-12-27 37:14

124. AI時代のGPUクラスタ、DCネットワーク w/ markunet, aztecher_

spotify apple_podcasts

LINEヤフーのKobayashiさん、Michishitaをゲストに、GPUネットワークやGPUクラスタの仮想化の複雑さなどについて語っていただいたエピソードです。

話したネタ

  • https://speakerdeck.com/lycorptech_jp/20241202
  • GPUクラスタとその必要性
  • GPUクラスタの運用上の課題
  • 自社でGPUを運用するメリットとデメリット
  • GPUを自前で運用する際の課題と対策
  • GPUネットワークと従来のネットワークとの違い
  • CLOS
  • RDMA(Remote Direct Memory Access)とその特性
  • TCP/IPとの比較、およびRDMAの利点
  • GPU間通信のための専用物理GPUネットワーク
  • GPUネットワークにおける輻輳制御とその課題
  • ロスレスイーサネット
  • RoCE v2
  • 仮想化による複雑性とネットワーク構成への影響
  • 仮想化環境でのGPUとNICの扱い
  • JANOG55
  • LINEヤフー Tech Blog


See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

37:14

コメント

スクロール