什麼是TDP和PUE?認識散熱需求與方案

thermal module


隨著科技的迅速發展,電子設備的性能提升帶來了顯著的熱量生成挑戰。無論是日常使用的個人電腦,還是支撐著大量運算工作的數據中心,這些系統都需要有效的散熱設計來確保穩定運行。散熱需求的演進在過去二十年間逐步顯現,尤其是在處理器與圖形卡的功耗逐年增加的情況下,散熱系統必須跟上以維持最佳效能。現代的散熱設計不僅僅是為了保護硬體,還涉及到能源使用效率的考量,例如 TDP(熱設計功耗)和 PUE(電源使用效率)這些指標。

TDP(Thermal Design Power,熱設計功耗)

TDP是指處理器在高負載運行時所產生的最大熱量,單位為瓦特(W)。這一指標為散熱系統的設計提供了參考,確保設備在高負載運行時能夠有效地散熱,避免過熱導致性能下降或損壞。需要注意的是,TDP並不代表處理器的最大功耗,而是散熱系統需要處理的熱量上限。
高TDP的處理器需要更高效的散熱器來避免過熱,否則可能導致處理器自動降頻或系統不穩定。此外,在伺服器和高效能計算設備中,TDP是設計機房散熱系統的重要參數。

PUE(Power Usage Effectiveness,電源使用效率)

●PUE= IT 設備能耗 ÷ 數據中心總能耗
數據中心總能耗:指數據中心的總電力消耗,包括IT設備(伺服器、儲存設備、網路設備)和支持設備(如冷卻、照明、UPS等)的所有電力消耗。
●IT設備能耗:僅指數據中心內部 IT 設備的電力消耗,不包含冷卻系統和其他支持設備。

PUE是衡量數據中心能源效率的指標,計算方式為數據中心總能耗除以 IT 設備能耗。PUE值越接近1,表示數據中心的能源利用越有效,非IT設備的能耗越低。理想的PUE值為1.0,代表所有能源都用於IT設備,無額外的能耗。這部分需要優化冷卻系統,減少非IT設備的能耗,從而降低整體能耗和運營成本。

如何降低PUE?

●改善冷卻系統:使用液冷、空氣冷卻優化設計、自然冷卻或使用更高效的冷卻設備。
●優化氣流管理:防止冷熱空氣混合,確保冷空氣能有效冷卻伺服器。
●採用節能設備:使用更節能的伺服器和儲存設備,降低 IT 設備的能耗。
●調整溫度與濕度設定:提高數據中心的室溫至合理範圍,可以減少冷卻系統的能耗。
●利用可再生能源:部分數據中心採用太陽能、風能等再生能源以減少對傳統能源的依賴。

TDP是針對單個電子設備設計的散熱需求指標,描述了設備在高負載下產生的最大熱量。主要用於設計和選擇冷卻系統,以確保設備在滿負荷運行時能有效散熱,避免過熱。有效的冷卻方案需要滿足或超過TD的要求。而PUE是聚焦在整個數據中心層級的指標,用於衡量數據中心的能源使用效率,表示多少能源用於 IT 設備,相對於多少能源被消耗在其他非IT設備上。

數據中心的PUE不僅取決於IT設備的能耗,還受冷卻系統、照明和其他基礎設施的耗電影響。因此,如果冷卻系統設計不良或效率低下,會導致冷卻耗電量高,進而提升PUE值,降低數據中心的能源使用效率。因此可以通過降低TDP較高的設備(例如使用低功耗處理器),數據中心可以減少冷卻能耗,從而降低PUE。這是一種通過減少散熱需求來間接提高能源效率的方法。當然理想上還是需要更高效的散熱系統來確保即使在高TDP設備的情況下,也能保持數據中心的能源使用效率。


想了解有關熱導管的構造、工作原理、種類與應用的知識嗎?
Further Reading :《超高效導熱元件 – 熱導管的原理及應用》

熱設計功耗需求的演進

隨著人工智慧和高性能計算(HPC)的快速發展,通用圖形處理單元(GPGPU)的需求持續增長。其中生成式AI的興起,如ChatGPT等大型語言模型,對計算資源的需求大幅增加。根據TrendForce的統計,2022年至2026年的年複合成長率達 29%。
因此隨著計算資源的需求大幅增加,GPGPU的熱設計功耗也不斷提升,傳統的氣冷散熱方式逐漸無法滿足需求。例如NVIDIA H100的TDP已達 700W。目前主流伺服器高階CPU的TDP已達350~400W,GPGPU和交換機IC更已突破 600W、800W,基本上達350W都建議使用液冷了,因此液冷技術的導入將成為散熱解決方案的主流。

主流GPGPU (通用圖形處理單元)自2008年至今的TDP(熱設計功耗)數據

在追求高性能的同時,能源效率成為重要考量。液冷散熱系統在降低能耗方面表現優異,根據 NVIDIA測試,液冷可使機櫃量減少66%、能耗減少28%、PUE從1.6降至1.15的優秀成績。

隨著電子設備的高功耗需求,特別是在GPGPU與數據中心的應用場景中,直接液冷(Direct Liquid Cooling, DLC)技術成為散熱解決方案中的一大亮點。對於高TDP設備而言,液冷技術不僅能有效降低運行溫度,還能維持設備穩定性,特別是在處理AI和高性能運算的GPGPU系統中,其重要性愈發凸顯。

液冷技術的主流趨勢

在液冷技術領域,主要分為兩大類型:直接液冷(Direct Liquid Cooling, DLC)和間接液冷(Indirect Liquid Cooling)。

直接液冷(DLC):
DLC技術直接將冷卻液與發熱元件接觸,透過冷板或浸沒方式有效帶走熱量。此技術適用於高熱密度的設備,如高性能計算(HPC)系統和資料中心伺服器。根據市場研究報告,全球液冷系統市場規模預計將從2023年的42.7億美元增長至2030年的105.1億美元,年複合增長率為13.70%。其中,直接液冷技術因其高效能和節能特性,特別適用於高性能計算(HPC)和資料中心等領域,預計在未來的市場中將佔有更大的份額。

間接液冷:
間接液冷系統中,冷卻液在封閉的管道中循環,透過熱交換器與發熱元件交換熱量,避免冷卻液直接接觸電子元件。此技術常用於傳統資料中心和IT設備的冷卻。目前,間接液冷技術在市場上佔有較大份額,主要因其技術成熟度高,且對現有基礎設施的改造需求較低。然而,隨著高熱密度設備的普及和對能源效率的更高要求,直接液冷技術的應用正在快速增長,特別是在需要高效散熱的領域。

雖然間接液冷技術目前仍是市場主流,但直接液冷技術的市場佔有率正逐漸提升,未來有望在高性能計算和資料中心等領域佔據更大的市場份額。


想了解有關現代水冷技術液冷機構的知識嗎?
Further Reading :《The Rise of Liquid Cooling Systems – How Liquid Cooling Has Become the New Standard for High-Performance Devices》

Recommended Posts