GPU比CPU耗電?NVIDIA用自身行動回應(yīng)疑問
據(jù)國家發(fā)改委官方數(shù)據(jù),每消耗1噸標(biāo)準(zhǔn)煤,數(shù)據(jù)中心直接貢獻(xiàn)產(chǎn)值1.1萬元,數(shù)字產(chǎn)業(yè)化增加貢獻(xiàn)值88.8萬元,此外還可帶動各行業(yè)數(shù)字化轉(zhuǎn)型,間接產(chǎn)生360.5萬元的產(chǎn)業(yè)數(shù)字化市場。但是與此同時(shí),由于數(shù)據(jù)中心耗電量不斷刷新紀(jì)錄,在碳達(dá)峰、碳中和目標(biāo)下,數(shù)據(jù)中心的節(jié)能減排也備受關(guān)注。
隨著人工智能類工作負(fù)載的流行,GPU已經(jīng)成為數(shù)據(jù)中心的標(biāo)配。無論是通過云還是在本地?cái)?shù)據(jù)中心,各大公司在采用AI等技術(shù)的同時(shí),計(jì)算的能耗也在日益提升。在我們的常識中,GPU是比CPU更加耗電。那么這是否意味著GPU會加大數(shù)據(jù)中心的能耗呢?
其實(shí),對于AI工作負(fù)載,NVIDIA GPU的能效是傳統(tǒng)CPU服務(wù)器的42倍。NVIDIA的HGX-A100云服務(wù)器平臺將16個(gè)NVIDIA V100 Tensor Core GPU連接在一起,可作為單一巨型GPU運(yùn)行,提供2petaflops的AI性能,創(chuàng)下了單臺服務(wù)器AI訓(xùn)練算力的紀(jì)錄。
在短短兩年內(nèi),NVIDIA AI系統(tǒng)將在單一服務(wù)器上訓(xùn)練圖像識別模型ResNet-50的時(shí)間從8小時(shí)減少至40分鐘。隨著AI采用的加速,NVIDIA的重點(diǎn)從訓(xùn)練轉(zhuǎn)移到推理,使經(jīng)過訓(xùn)練的模型能夠在全球數(shù)百萬臺超大規(guī)模服務(wù)器運(yùn)行的實(shí)時(shí)應(yīng)用程序中運(yùn)行。
NVIDIA的TensorRT推理軟件甚至能夠助力最大型神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)中心、嵌入式和汽車等多種應(yīng)用中實(shí)時(shí)運(yùn)行。A100比CPU快237倍。與其所取代的基于CPU的系統(tǒng)相比,配備NVIDIA GPU和TensorRT的超大規(guī)模數(shù)據(jù)中心占用的機(jī)架空間僅為其1/47,運(yùn)行的能源成本降低了95%,同時(shí)還能提供運(yùn)行所有AI模型的實(shí)用程序。
NVIDIA的綠色化
對于NVIDIA的Logo我們一定不陌生,其實(shí)NVIDIA一直通過以降低環(huán)境影響的方式推動卓越運(yùn)營,從而保護(hù)環(huán)境。
NVIDIA實(shí)施了符合 ISO 50001標(biāo)準(zhǔn)的能源管理體系,以采用更加結(jié)構(gòu)化的方法來管理NVIDIA的幾處重要的數(shù)據(jù)中心所在地的能源效率。
2021財(cái)年,數(shù)據(jù)中心占NVIDIA總能源使用量的46%,隨著NVIDIA布局的擴(kuò)大,NVIDIA將能源效率納入了NVIDIA擁有的新建筑的設(shè)計(jì)中,NVIDIA在英國劍橋的全新超級計(jì)算機(jī)的所在地和位于達(dá)拉斯的數(shù)據(jù)中心都簽署了新的可再生能源供應(yīng)合同。
NVIDIA還致力于采用更多可再生能源運(yùn)營自身的數(shù)據(jù)中心。2021財(cái)年,NVIDIA有17處辦公地點(diǎn)完全采用可再生能源供電。NVIDIA的目標(biāo)是到2025年,全球65%的用電來自太陽能等來源。
隨著業(yè)務(wù)不斷擴(kuò)展,并通過新的在線服務(wù)來實(shí)現(xiàn)多元化,數(shù)據(jù)中心運(yùn)營也在快速發(fā)展。在NVIDIA的全球數(shù)據(jù)中心足跡出現(xiàn)這種增長趨勢的過程中,NVIDIA努力將環(huán)境因素(包括能效和可再生能源選項(xiàng))納入NVIDIA的數(shù)據(jù)中心選址和采購評估中。過去的兩年中,NVIDIA重新為美國和全球的數(shù)個(gè)主機(jī)托管數(shù)據(jù)中心提供了可再生能源。
隨著NVIDIA數(shù)據(jù)中心業(yè)務(wù)的增長,NVIDIA已經(jīng)部署了專為NVIDIA服務(wù)器產(chǎn)品設(shè)計(jì)的最新冷卻技術(shù)。配電增加了電壓供應(yīng),以更有效地輸送電能。冷卻解決方案與服務(wù)器機(jī)架緊密結(jié)合,以定位并優(yōu)化熱傳遞。NVIDIA使用計(jì)算流體動力學(xué)模型來增強(qiáng)數(shù)據(jù)中心設(shè)計(jì)和服務(wù)器機(jī)架部署的散熱。數(shù)據(jù)中心還部署了白色表面以優(yōu)化反射照明?煽匦透咝ED照明安裝在需要人工照明之處。這一系列的舉措讓數(shù)據(jù)中心的能耗控制更高效。
NVIDIA與客戶和合作伙伴共享NVIDIA的數(shù)據(jù)中心最佳實(shí)踐和優(yōu)化方法,以進(jìn)行部署相關(guān)的教育,并優(yōu)化部署。例如,NVIDIA與領(lǐng)先的存儲和網(wǎng)絡(luò)技術(shù)提供商合作,提供參考架構(gòu)組合,以實(shí)現(xiàn)NVIDIA DGX服務(wù)器產(chǎn)品的優(yōu)化和高效部署,并在NVIDIA的網(wǎng)站上公開提供這些架構(gòu)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
