在2021年4月舉行的GTC春季大會期間,Nvidia推出更多款Ampere架構的資料中心等級GPU,包括:A30、A10、A16,但當時公開前兩款GPU的細部規格,A16則是到了12月1日才宣告全面上市,

若要選購,可洽詢Dell、技嘉科技、Supermicro等伺服器廠商。

事實上,稍早在11月舉行的GTC秋季大會期間,Nvidia與硬體設備廠商PNY在他們的線上演講當中,更完整揭露A16的架構與細部規格。

回顧Nvidia最初於4月披露A16的相關消息,他們提到哪些特色?就產品應用的層面而言,它是鎖定導入桌面虛擬化/虛擬桌面基礎架構(VDI)的企業環境,能搭配該公司的vPC軟體,可讓使用多種電腦與螢幕的資訊工作者,以及位於遠端環境的團隊成員,透過簡易的存取方式,執行各種提供辦公生產力的工具軟體與應用程式。

相較於前代支援企業級GPU虛擬化(vGPU)應用的產品M10,Nvidia新推出的A16在負荷的使用者密度上,能夠達到更高的表現,以單張GPU加速卡而言,可同時承擔64個使用者的遠端辦公處理需求(收發電子郵件、網頁瀏覽、進行視訊會議),而在總體擁有成本上,可減少20%。

而當時Nvidia公布的硬體規格,其實已列出頗多資訊,像是外形為全高全長尺寸、雙插槽,I/O介面為PCIe 4.0 x16,採用被動散熱,最大耗電量為250瓦,支援的vGPU軟體類型涵蓋vPC、vApps、vWS、vCS。但這當中有部分規格與過往Nvidia GPU的典型配置相比,似乎有些古怪之處,例如,在GPU記憶體、GPU記憶體頻寬的規格上,Nvidia均額外標示了「4x」,例如,前者為4x 16 GB GDDR6,後者則是4x 232GB/s,而所謂的4x,可能是指4個或4倍。

到了12月,A16宣告正式推出,Nvidia公布詳細規格資訊,關於為何會有上述令人困惑的組態,答案也隨之揭曉。

因為,在板卡的設計上,A16一口氣搭配了4個Ampere架構的GPU,能混合使用多個vGPU組態設定(profile),而基於這樣的彈性,企業IT部門不僅能在一張GPU加速卡當中,支援輕量級的虛擬個人電腦工作負載,也能支援重量級的系統執行需求(大量記憶體與繪圖運算資源),也因為可同時負荷不同的GPU使用組態,而使得A16更能充分支援多種vGPU軟體應用類型。

這樣的設計,也反映在A16的GPU核心配置與運算效能數值。以CUDA核心而言,Nvidia在這裡標示為4x 1280,也就是4個GPU,每個GPU搭配1280個CUDA核心的意思;在Tensor核心的部分,Nvidia標示為4x 40,亦即配置4個GPU,每個GPU搭配40個Tensor核心;在RT核心的部分,Nvidia標示為4x 10,同樣意指搭配4個GPU,每個GPU搭配10個RT核心。

值得注意的是,A16也配備了大量的硬體視訊編解碼器,因為在單一板卡中,Nvidia搭配4個編碼器NVENC,以及8個解碼器NVDEC,可針對編碼、解碼、轉碼等作業,可支援極大的視訊串流處理數量,提供更理想的處理效能。

基於這樣的規格,A16具備最大的編碼吞吐量與畫面緩衝容量,能針對採用vPC軟體而成的VDI環境,提供更好的用戶操作體驗。除此之外,內建多個編解碼器的A16,也能充分支援視訊轉碼的作業,以及Android雲端遊戲的應用架構。

除了硬體本身的特性,關於軟體平臺層面的支援,Nvidia也在2021年8月發布GPU虛擬化軟體的第13個版本,開始支援A16,11月推出的13.1版在vGPU的CUDA profiler應用上,也涵蓋到這款新上市的資料中心GPU加速卡。

產品資訊

Nvidia A16
●原廠:Nvidia
●建議售價:廠商未提供
●外型:雙寬全高全長介面卡(PCIe 4.0 x16)
●GPU架構:Ampere
●GPU核心:4顆GPU(每顆GPU為1,280顆CUDA核心、40顆Tensor核心、10顆RT核心)
●GPU記憶體:單顆GPU為 16 GB GDDR6
●記憶體頻寬:200 GB/s
●運算效能:單顆GPU的FP32運算為4.5 TFLOPS
●GPU互連介面頻寬:N/A
●運算效能:單顆GPU為FP32為4.5 TFLOPS
●多媒體引擎:4個NVENC、8個 NVDEC
●支援運算API:CUDA、DirectCompute、OpenCL、OpenACC
●支援繪圖API:DirectX 12.072、Shader Model 5.172、OpenGL 4.683、Vulkan 1.183
●最大耗電量:250瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】


熱門新聞

Advertisement