一、引述
隨著數(shù)據(jù)中心技術(shù)的發(fā)展與演進(jìn),新型數(shù)據(jù)中心不斷涌現(xiàn),如智能計(jì)算數(shù)據(jù)中心等。與傳統(tǒng)數(shù)據(jù)中心相比,新型數(shù)據(jù)中心具有高技術(shù)、高算力、高能效、高安全等特征,更能有效支撐經(jīng)濟(jì)社會的數(shù)字轉(zhuǎn)型。所謂智能計(jì)算數(shù)據(jù)中心,是指基于GPU、FPGA等芯片構(gòu)建智能計(jì)算服務(wù)器集群,提供智能算力的基礎(chǔ)設(shè)施。主要應(yīng)用于多模態(tài)數(shù)據(jù)挖掘、智能化業(yè)務(wù)高性能計(jì)算、海量數(shù)據(jù)分布式存儲調(diào)度、人工智能模型開發(fā)、模型訓(xùn)練和推理服務(wù)等場景。智能計(jì)算數(shù)據(jù)中心的新型數(shù)據(jù)中心的出現(xiàn),得益于GPU、FPGA、NPU等芯片技術(shù)被引入到服務(wù)器中。
欲詳細(xì)了解數(shù)據(jù)中心介紹的請進(jìn)入。
圖形處理單元(GPU,Graphics Processing Unit)是一種專門用于圖形處理的芯片,它通常包含數(shù)百個(gè)小型處理核心,可以并行地執(zhí)行大量數(shù)據(jù)密集型計(jì)算任務(wù)。GPU最初是為了處理3D圖形而設(shè)計(jì)的,但現(xiàn)在已經(jīng)廣泛應(yīng)用于科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、人工智能等領(lǐng)域。GPU通常具有高吞吐量和并行性能,但功耗較高且需要大量數(shù)據(jù)并行化才能發(fā)揮最大性能。
欲更多了解英偉達(dá)的數(shù)據(jù)中心用GPU性能參數(shù)介紹的請進(jìn)入。
現(xiàn)場可編程門陣列(FPGA,Field Programmable Gate Array)是一種可編程邏輯芯片,它可以被重新編程以執(zhí)行特定的任務(wù)。FPGA由大量的可編程邏輯單元和可編程連接器組成,這些單元和連接器可以被重新配置以實(shí)現(xiàn)不同的電路功能。FPGA通常用于需要高度定制化、低功耗和低延遲的應(yīng)用,例如數(shù)字信號處理、圖像處理、網(wǎng)絡(luò)加速、嵌入式系統(tǒng)等。
神經(jīng)網(wǎng)絡(luò)處理單元(NPU,Neural Processing Unit)是一種專門用于進(jìn)行深度學(xué)習(xí)計(jì)算的芯片。它是近年來人工智能領(lǐng)域的熱門技術(shù)之一,被廣泛應(yīng)用于各種人工智能應(yīng)用中,如自動駕駛、人臉識別、智能語音等領(lǐng)域。目前,大多數(shù)NPU都需要與其他芯片(如CPU、GPU等)進(jìn)行配合使用,才能完成整個(gè)計(jì)算任務(wù)。NPU是人工智能發(fā)展的重要組成部分,具有高效、低能耗、低延遲、穩(wěn)定、可編程等優(yōu)勢。
二、關(guān)于算力的概念
1、算力的定義
算力(CP,Computational Power)是指計(jì)算設(shè)備或系統(tǒng)在單位時(shí)間內(nèi)處理數(shù)據(jù)或執(zhí)行計(jì)算任務(wù)的能力,是衡量計(jì)算效率的核心指標(biāo)。其核心價(jià)值在于解決復(fù)雜問題、加速任務(wù)處理及支撐大規(guī)模計(jì)算需求。
數(shù)據(jù)中心的計(jì)算能力,是指數(shù)據(jù)中心的服務(wù)器通過對數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)結(jié)果輸出的一種能力,是衡量數(shù)據(jù)中心計(jì)算能力的一個(gè)綜合指標(biāo),數(shù)值越大代表綜合計(jì)算能力越強(qiáng)。算力應(yīng)是數(shù)據(jù)中心內(nèi)所有服務(wù)器的算力加和,即:
CP = ∑CP服務(wù)器
2、算力的要素
算力(CP)的核心要素包括通用算力、智能算力和超級算力。通用算力(CPN,CP-Normal)即為通用計(jì)算能力的簡稱;智能算力(CPT,CP-Turbo)即為智能計(jì)算能力(也稱高性能計(jì)算能力)的簡稱;超級算力(CPS,CP- Super)即為超級計(jì)算能力的簡稱。事實(shí)上,算力通常主要考核的是CPN和CPT。依據(jù)工信部《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》的要求,通用算力、智能算力和超級算力的含義詳見下表2-2;而數(shù)據(jù)中心的算力(CP)應(yīng)為:
CP = CP通用 + CP智能 + CP超級 = CPN + CPT + CPS
表 2-2:通用算力(CPN)、智能算力(CPT)和超級算力(CPS)的含義
3、算力的單位
算力(CP)最常用的單位是FLOPS(Floating-point Operations Per Second,每秒浮點(diǎn)運(yùn)算次數(shù))。事實(shí)上,FLOPS已成為各種設(shè)施(如計(jì)算機(jī)、超算機(jī)、服務(wù)器等)衡量計(jì)算性能的代名詞。FLOPS是一個(gè)基本單位,它的更大的數(shù)值單位有k(千)、M(兆)、G(吉)、T(太)、P(拍)、E(艾)等,同樣以103遞增,它們之間的換算可詳見下表1-3。據(jù)測算,1艾(E)每秒浮點(diǎn)運(yùn)算次數(shù)(即1 E FLOPS)約為5臺天河2A或者50萬顆主流服務(wù)器CPU或者200萬臺主流筆記本的算力輸出。
表 1-3:FLOPS數(shù)值單位間的換算
4、算力的等級評價(jià)
算力(CP)的等級評價(jià)采用單物理機(jī)架精度(FP32)能力,單位通常采用為FLOPS/架或TFLOPS/架。1 T FLOPS/架即平均單機(jī)架每秒執(zhí)行1萬億次(T)浮點(diǎn)運(yùn)算。我們知道,浮點(diǎn)運(yùn)算的計(jì)算能力是需要考慮不同精度的浮點(diǎn)數(shù)的,在IEEE 754標(biāo)準(zhǔn)中定義了半精度(FP16)、單精度(FP32)和雙精度(FP64)的概念,其含義請參見下表1-4。
表 1-4:浮點(diǎn)運(yùn)算的精度:半精度、單精度和雙精度
三、算效的概念
1、算效的定義
算效(CE,Computational Efficiency)是指數(shù)據(jù)中心算力與功率的比值,即“數(shù)據(jù)中心每瓦功率所產(chǎn)生的算力”,是同時(shí)考慮數(shù)據(jù)中心計(jì)算性能與功率的一種效率。數(shù)值越大,代表單位功率的算力越強(qiáng),效能越高。若CP為以單精度浮點(diǎn)數(shù)(FP32)的數(shù)據(jù)中心的算力;PC IT為數(shù)據(jù)中心IT設(shè)備的整體功率,其單位為瓦(W),則算效CE的計(jì)算公式為:
CE = CP / PCIT
2、算效的單位
根據(jù)上述算效(CE)的定義,其單位應(yīng)為FLOPS /W,即單位功率(W)的算力(FLOPS)。
3、算效的類型
根據(jù)上述算力(CP)的核心要素,算效(CE)也分為通用算效(CEN)和智能算效(CET),與CPN和CPT相對應(yīng)。
4、算效的等級評價(jià)
算效(CE)的等級評價(jià)采用單精度(FP32)能力,單位通常采用為FLOPS/W或GFLOPS/W。1 GFLOPS/W即平均每瓦功率每秒執(zhí)行十億次(G)浮點(diǎn)運(yùn)算。
四、數(shù)據(jù)中心算力與算效的指標(biāo)要求
為了促使我國互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)的規(guī)劃、設(shè)計(jì)、建設(shè)、運(yùn)維和評估的實(shí)施,我國在2023年發(fā)布了國家標(biāo)準(zhǔn)GB/T 43331《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級要求》。該標(biāo)準(zhǔn)中對IDC的算力與算效規(guī)定了其指標(biāo)要求。GB/T 43331是將IDC分級定級為5個(gè)等級,從第一級到第五級,第五級技術(shù)要求最高。那么IDC的每個(gè)等級應(yīng)滿足的算力與算效指標(biāo)要求是不同的,具體匯列于下表4中。注意表中算力與算效的等級評價(jià)采用前述要求,即算力(CP)的評價(jià)單位為TFLOPS/架;算效(CE)的評價(jià)單位為GFLOPS/W。
表 4:GB/T 43331標(biāo)準(zhǔn)規(guī)定的不同等級IDC應(yīng)滿足的算力與算效指標(biāo)
欲詳細(xì)了解GB/T 43331國家標(biāo)準(zhǔn)具體內(nèi)容的請進(jìn)入。
欲進(jìn)一步了解我國算力發(fā)展國家政策指引要求的請進(jìn)入。