#聊一聊#NVidia DGX A100 PCI-E子系统 解决SW的upstream通道成为性能瓶颈问题
问题来源:书籍:《大模型时代的基础架构:大模型算力中心建设指南》章节:第四章GPU服务器的设计与实现;4.4NvidiaDGXA100PCI-E子系统的设计讨论问题:为了避免使PCI-E的upstream通道成为性能瓶颈,在调度GPU时通过建立绑定关系,令同一个PCI-ESwitch下的一个GPU、一张CX6网卡和一块SSD卡绑定为一组,即每个PCI-ESwitch下有两组,NvidiaDGXA100PCI-E子系统下共可分为8组。那么这种分组就是将upstre