AWS發表了最新配備Nvidia A100 Tensor Core GPU的P4執行個體,P4搭載英特爾Cascade Lake處理器,並且擁有8個A100 GPU,每個GPU以NVLink相連,並且支援可提升GPU載入大型資料集速度的GPUDirect儲存技術。

P4執行個體因為擁有高達2.5 PetaFLOPS的浮點運算效能,以及320 GB的高頻寬GPU記憶體,因此能夠獲得的深度學習效能,是P3執行個體的2.5倍,還能降低60%的訓練成本。而且P4執行個體有1.1 TB的系統記憶體,和8 TB支援NVMe技術的SSD儲存,每秒可提供16 GB的資料吞吐量,在網路方面,P4執行個體可以連接4個100 Gbps網路線路,AWS提到,這些網路線路專為P4設計,是PB等級無阻塞網路結構,可以支援19 Gbps EBS頻寬,最高支援可達80K IOPS。

綜合A100 GPU、GPUDirect的支援、400 Gbps網路、PB級網路架構,還有AWS ParallelCluster和S3等AWS服務的支援,用戶可以建立具有4,000個,甚至更多GPU的EC2超級叢集(UltraClusters),執行大規模地震分析、天氣預報和財務建模等工作負載。

     

P4執行個體只有一個規格p4d.24xlarge,現在已經可以在美東北維吉尼亞和美西奧勒岡使用,在今年稍晚,AWS還會推出使用P4執行個體運作的AWS服務,諸如Amazon SageMaker和AEK等。

熱門新聞


Advertisement