KPL
當(dāng)前位置: 首頁(yè) > 數(shù)碼科技

深入了解服務(wù)器液冷方式的多種選擇

2024-06-12 10:52:52 作者:小罐游戲 來(lái)源:小罐游戲

  以多樣選擇、靈活性和效率應(yīng)對(duì)服務(wù)器冷卻挑戰(zhàn)。

  戴爾科技持續(xù)“以科技創(chuàng)新推動(dòng)人類(lèi)進(jìn)步”的過(guò)程中,亦有障礙拖慢新的解決方案的應(yīng)用。在數(shù)據(jù)中心層面,人工智能(AI)工作負(fù)載便是其中的最典型代表。AI和其他高要求的工作負(fù)載須使用最新的GPU和CPU來(lái)提供所需的應(yīng)用性能,這意味著在部署規(guī)劃過(guò)程中散熱和功耗問(wèn)題時(shí)常出現(xiàn)。為解決這些問(wèn)題,戴爾科技的服務(wù)器散熱工程團(tuán)隊(duì)多年如一,堅(jiān)持提供以客戶(hù)為中心的戴爾科技智能冷卻(Dell Smart Cooling)創(chuàng)新解決方案,曾于2016年推出早期液冷服務(wù)器產(chǎn)品Triton。到2024年,戴爾科技提供的服務(wù)器冷卻解決方案包括Verne Global正在使用的Dell DLC3000直接液冷機(jī)架、單機(jī)架功率高達(dá)115千瓦的戴爾科技模塊化數(shù)據(jù)中心等。

  當(dāng)前的冷卻選擇

  最新的CPU和GPU對(duì)冷卻技術(shù)提出了新的要求,戴爾科技的PowerEdge產(chǎn)品組合支持不同的冷卻方式。傳統(tǒng)風(fēng)冷在應(yīng)對(duì)最新高功率服務(wù)器每個(gè)機(jī)架所產(chǎn)生的熱量時(shí)頗顯吃力,客戶(hù)也正尋求以更加可持續(xù)且低功耗的方式運(yùn)營(yíng)數(shù)據(jù)中心。因此,如今的數(shù)據(jù)中心冷卻方式和策略應(yīng)能滿(mǎn)足客戶(hù)日益增長(zhǎng)的多種冷卻需求。

  在構(gòu)建數(shù)據(jù)中心冷卻環(huán)境時(shí)最常用的技術(shù)包含以下幾種:

  · 直接液冷(DLC)使用冷板與CPU和GPU等內(nèi)部服務(wù)器元件直接接觸;然后依靠液體來(lái)冷卻冷板并將熱量從處理器中傳遞出去。

  · 行內(nèi)冷卻解決方案設(shè)計(jì)用于部署在數(shù)據(jù)中心機(jī)架旁的通道中,以冷空氣進(jìn)行冷卻并將其分配到精確位置。

  · 背門(mén)散熱(RDHx)通過(guò)安裝在服務(wù)器機(jī)架后部的液冷式熱交換器捕獲服務(wù)器排出的熱空氣中的熱量。

  · 封閉式冷卻指的是將熱氣封閉、冷卻并循環(huán),所有環(huán)節(jié)均與數(shù)據(jù)中心的任何其它冷卻空氣完全隔離。

  每種冷卻技術(shù)支持的機(jī)架熱密度和效率不同,為客戶(hù)提供了多樣的冷卻方案匹配實(shí)際需求。這些解決方案的部署位置從單機(jī)架到多通道不等。結(jié)合行或機(jī)架封閉結(jié)構(gòu),行內(nèi)冷卻器可100%捕獲機(jī)架上IT設(shè)備所產(chǎn)生的熱量。如此一來(lái),數(shù)據(jù)大廳內(nèi)的空調(diào)部署就只需照顧到工作人員即可。RDHx同樣也能捕獲IT設(shè)備所產(chǎn)生的全部熱量,用于機(jī)架上的設(shè)施水,并同時(shí)調(diào)節(jié)空間內(nèi)的空氣。由于這種空調(diào)式的功能,RDHx中設(shè)施水的水溫必須比使用行內(nèi)冷卻器時(shí)更低,前者最高約為20℃,而后者最高可達(dá)32℃。采取較高的設(shè)施水溫,能夠降低冷卻器的運(yùn)行能耗,這一點(diǎn)雖然可喜,但冷卻方案的整體效率并不止于此。

  通過(guò)將這些熱量捕獲率可達(dá)100%的技術(shù)與DLC相結(jié)合,IT設(shè)備冷卻所需的風(fēng)扇功率得以降低,進(jìn)一步提高了效率。

圖片1.jpg

客戶(hù)需求與戴爾科技建議的冷卻解決方案

  服務(wù)器冷卻效率

  不同的解決方案和方式在冷卻過(guò)程中所消耗的功率也不同。下圖顯示了在冷卻典型的雙CPU服務(wù)器機(jī)架時(shí)不同冷卻方式的年能耗,分別包含了每種冷卻方式的IT能耗和冷卻能耗。IT能耗即包含內(nèi)部風(fēng)扇在內(nèi)的服務(wù)器內(nèi)部能耗總和;冷卻能耗則代表服務(wù)器外部的冷卻裝置(如冷卻劑分配單元,CDU和機(jī)房空氣處理器,CRAH)和數(shù)據(jù)中心外部的風(fēng)冷冷卻器的能耗。

圖片2.jpg

不同冷卻方式的能耗

  柱狀圖中第一根柱圖表示的是典型數(shù)據(jù)中心的能耗情況,這種數(shù)據(jù)中心使用安裝在數(shù)據(jù)大廳四周的空氣處理器將空氣吹向服務(wù)器。接下來(lái),通過(guò)采用DLC來(lái)冷卻每臺(tái)服務(wù)器的CPU,可比僅使用周邊空氣處理器進(jìn)行空氣冷卻節(jié)省約11%的總能耗。而如果用部署于每個(gè)機(jī)架上的RDHx取代周邊冷卻,則每年可減少16%的能耗,在此基礎(chǔ)上再增加DLC可進(jìn)一步減少2%的能耗。如上所述,如果將IT部署在帶有行內(nèi)冷卻器的封閉式機(jī)柜內(nèi),則可使用溫度較高的水,這也使得其能耗較周邊空氣處理器減少19%。最后,通過(guò)將封閉式冷卻與DLC相結(jié)合,相較傳統(tǒng)冷卻機(jī)架可降低23%的能耗。

  戴爾科技解決方案的優(yōu)勢(shì)

  市場(chǎng)上有許多可供選擇的冷卻方式。例如一些廠(chǎng)商選擇在其他內(nèi)部服務(wù)器組件(如內(nèi)存、網(wǎng)絡(luò)接口、存儲(chǔ)等)上使用直接液冷,讓DLC解決方案觸及服務(wù)器內(nèi)部的幾乎所有發(fā)熱組件。通常情況下,這類(lèi)解決方案需要定制化的銅制冷板并在服務(wù)器內(nèi)部鋪設(shè)額外的管道,使所有組件都與液體接觸。在戴爾科技,昂貴且復(fù)雜的銅冷板冷卻方式絕非最佳解決之道,將液體冷卻和空氣冷卻同時(shí)加入到混合式服務(wù)器冷卻解決方案中則可以給企業(yè)帶來(lái)諸多優(yōu)勢(shì):

  · 服務(wù)器配置的靈活性顯著提高??蛻?hù)可自行決定服務(wù)器配置(內(nèi)存、PCIe卡、存儲(chǔ)等),而不必受制于某一種服務(wù)器冷板設(shè)計(jì)。

  · 設(shè)計(jì)中的軟管和接頭數(shù)量大幅減少,降低發(fā)生泄露的概率。

  · 現(xiàn)場(chǎng)服務(wù)程序簡(jiǎn)單,便于更換服務(wù)器組件。

  · 服務(wù)器選擇范圍廣泛。

  戴爾科技的混合式冷卻方式復(fù)雜性較低,能夠在出現(xiàn)新的和不同的處理器和服務(wù)器平臺(tái)時(shí)更加靈活迅速地為其提供冷卻。

  戴爾科技的內(nèi)部模型分析表明,如果低水溫解決方案的設(shè)計(jì)合理且管理完善,那么“風(fēng)冷+DLC”混合冷卻部署方式的冷卻能耗僅比其他一些廠(chǎng)商使用的“全冷板冷卻方式”高出3%-4%,并能夠帶來(lái)上述優(yōu)勢(shì)1。

  充分利用新一代智能冷卻技術(shù)

  戴爾科技延續(xù)其開(kāi)放靈活的冷卻策略,為客戶(hù)提供具有多種選擇,而非“一刀切”的冷卻方式。目前,這些先進(jìn)的數(shù)據(jù)中心冷卻方式正在從高性能計(jì)算集群向主流部署發(fā)展,為支持AI和其他高強(qiáng)度工作負(fù)載的下一代頂尖性能服務(wù)器提供助力。戴爾科技的智能冷卻解決方案已幫助許多PowerEdge客戶(hù)提高了服務(wù)器的整體冷卻能力、能效和可持續(xù)性。

LPL
熱門(mén)文章
美圖



微信/QQ:251201708