
AI 伺服器功耗愈來愈高,很多人會直覺認為「整台泡進液體裡」一定比冷板更強。不過,液冷選型不是只比誰帶走更多熱,而是要一起看機房能不能改、設備如何維修、材料是否相容,以及故障時能否快速恢復。
先說答案:既有機房、多品牌伺服器與頻繁維修的環境,通常先評估冷板液冷;若是新建高密度機房、設備配置可標準化,而且團隊能接受槽體式維修流程,才適合進一步評估浸沒式液冷。本文會從兩者的熱傳路徑開始,整理成可以實際使用的選型順序。
文章目錄
- 兩種液冷真正差在哪裡?
- 冷板液冷如何把熱帶出伺服器?
- 浸沒式液冷如何運作?
- 浸沒式液冷與冷板液冷快速比較
- 散熱能力不能只看冷卻液接觸面積
- 維修方式與材料相容性差異更關鍵
- 既有機房與新建機房該怎麼選?
- 單相與雙相系統要另外判斷
- 用五個問題完成液冷選型
- 既有機房先看冷板,極高密度新建案再評估浸沒式
兩種液冷真正差在哪裡?
冷板液冷與浸沒式液冷最大的差異,是冷卻液接觸到哪裡。冷板液冷又常稱為直接到晶片液冷(Direct-to-Chip Liquid Cooling),冷卻液流經貼在 CPU、GPU 或交換器晶片上的冷板,透過金屬與熱介面材料吸收熱量;冷卻液通常不直接碰觸電路板。
浸沒式液冷(Immersion Cooling)則把伺服器主機板或整套 IT 設備浸入不導電的介電液體。液體可接觸記憶體、電源元件與電路板等更多表面,再把熱量送往外部熱交換器。Open Compute Project(OCP)的浸沒液規格也將冷板與浸沒式列為資料中心主要液冷路線,且兩者都可能採單相或雙相設計。
若還不熟悉液冷系統的泵、管路與熱交換架構,可以先參考液體冷卻系統的基本原理。真正選型時,不能把「液冷」視為單一技術。
冷板液冷如何把熱帶出伺服器?
冷板液冷的熱路徑通常是「晶片 → 熱介面材料 → 冷板 → 冷卻液 → 冷卻液分配單元 → 設施水」。冷卻液分配單元(Cooling Distribution Unit,CDU)會隔開 IT 側與設施側迴路,並負責流量、壓力、溫度及水質管理。
這種架構的優點是能優先處理 CPU、GPU 等主要熱源,同時保留接近傳統機架式伺服器的外形。既有資料中心可分區導入,不必一次把所有機櫃改成槽體。不過,沒有接上冷板的記憶體、電源、儲存裝置與網路元件仍可能需要風扇,因此冷板液冷常是液體與空氣並存的混合系統。ASHRAE 的資料中心指引也提醒,許多液冷設備並非完全由液體冷卻,機房仍需處理剩餘的空氣熱負載。
冷板性能還取決於流道、壓降、流量分配與接觸熱阻。若要進一步理解微流道、鰭片與材料差異,可延伸閱讀水冷板的五項設計重點。
浸沒式液冷如何運作?
浸沒式液冷使用與電子設備相容的介電液體,讓更多元件表面直接把熱傳給液體。單相系統中,液體吸熱後仍保持液態,經泵送至熱交換器或 CDU 冷卻,再回到槽內;雙相系統則讓液體在熱源附近沸騰,蒸氣上升到冷凝器後凝結回流。
因為槽內不需要依賴伺服器風扇維持主要對流,浸沒式方案可以減少風扇與氣流管理需求,也能處理灰塵較多或空氣條件不理想的環境。不過,它不是把標準伺服器直接放進任何絕緣油就能運作。處理器、主機板、連接器、線材、標籤、密封材料、儲存裝置與保固條件,都必須經過設備商與冷卻液供應商驗證。Intel 對浸沒式相容性的公開說明也要求使用者向 OEM 確認適用機型。
浸沒式液冷與冷板液冷快速比較
| 比較項目 | 冷板液冷 | 浸沒式液冷 |
|---|---|---|
| 冷卻液接觸範圍 | 主要接觸冷板內部 | 直接接觸大部分電路與元件 |
| 機架形式 | 可保留標準或近似標準機架 | 多改用水平或專用槽體 |
| 既有機房改造 | 可分階段導入,但要增加管路與 CDU | 機房布局、搬運與維修流程通常要重做 |
| 剩餘空氣散熱 | 常需要 | 可大幅降低,但仍依系統設計而定 |
| 維修方式 | 關閉迴路、拆管或使用快接頭後抽換 | 設備需從液體取出、滴乾與清潔後維修 |
| 主要風險 | 接頭漏液、堵塞、腐蝕、水質與流量失衡 | 材料相容性、液體老化、污染、槽體與搬運管理 |
| 硬體通用性 | 較容易沿用既有伺服器生態 | 需確認整機、元件、冷卻液與保固相容性 |
| 適合情境 | 既有機房、漸進改造、局部高熱元件 | 新建高密度機房、設備標準化、環境條件特殊 |
這張表的重點不是判定浸沒式一定更強,而是看哪一種方案對既有營運流程的衝擊較小。冷板把工程難題集中在流體迴路與接觸介面;浸沒式則把問題擴大到整台設備與液體的長期相容性。
散熱能力不能只看冷卻液接觸面積
浸沒式液體能接觸較多元件,不代表晶片接面溫度一定比較低。CPU 或 GPU 內部的熱仍要穿過晶片、封裝與散熱介面,最後才進入液體。局部熱流密度很高時,是否有合適的熱擴散器、冷板微結構或沸騰表面,往往比「整台有沒有泡在液體裡」更關鍵。
冷板液冷雖然只處理指定元件,卻能把流量與壓降集中在最主要的熱點。若冷板接觸壓力不足、熱介面材料厚度不均,系統即使有很大的泵也無法補救接觸熱阻。這也是熱介面材料與接觸熱阻仍然重要的原因。
評估散熱能力時,至少要同時確認單一晶片功耗、熱流密度、允許接面溫度、進出液溫差、流量、壓降、剩餘空氣熱負載,以及設施端能提供的水溫。只比較供應商宣稱的機櫃功率密度,很容易忽略實際邊界條件。
維修方式與材料相容性差異更關鍵
冷板系統最常被關注的是漏液,但實務上還要管理快接頭壽命、管路顆粒、異種金屬腐蝕、冷卻液導電度與各支路流量。OCP 的冷板迴路要求因此包含液體安全資料、洩漏偵測、應變計畫及冷卻液處置等項目。維修前也要確認隔離閥、排液方式與快接頭能否讓單台伺服器安全下架。
浸沒式系統省去了伺服器內許多風扇與水管接頭,卻增加另一組維修工作:設備從槽體取出後需要滴液、搬運和防污染;某些膠材、塑膠、電纜外皮、標籤或儲存裝置可能吸收液體、膨潤或劣化。冷卻液也要監測含水量、酸值、介電強度、黏度與污染物,不能只看初始熱物性。
因此,可靠度不能簡化成「冷板會漏、浸沒式不會漏」。兩者只是失效位置不同:冷板偏向接頭與迴路,浸沒式偏向材料、液體與作業流程。
既有機房與新建機房該怎麼選?
既有機房通常已經有標準機架、線槽、地板承載、消防與維修動線。冷板液冷可以從高功耗機櫃開始,加裝 CDU、供回液管路與漏液偵測,其他設備仍維持原本方式。它不是零改造,但比較容易分期導入,也能保留多數既有備品與操作習慣。
浸沒式液冷更適合從機房規劃初期就納入。槽體的占地、滿液重量、吊掛或升降設備、纜線走向、消防策略、液體儲存與維修區都要一起設計。如果只是把槽體塞進原有機房,可能節省了風扇電力,卻在地板承載、作業空間與設備相容性付出更高代價。
能源效率也要看完整系統。美國能源部指出,直接液冷可藉由泵送液體取代部分風扇與空氣搬運而降低 PUE 與用水,但結果仍受氣候、設施水溫與最終排熱方式影響。若要理解 TDP 與整座機房 PUE 的差別,可參考TDP 與 PUE 的判讀方式。
單相與雙相系統要另外判斷
「冷板或浸沒式」描述的是冷卻液接觸設備的位置;「單相或雙相」描述的是冷卻液有沒有發生相變,兩組分類不能混為一談。單相系統透過液體升溫帶走顯熱,控制與維護通常較直觀;雙相系統利用沸騰與冷凝的潛熱,能在較小溫差下處理高熱流,但流動穩定、壓力、冷凝器與冷媒管理更複雜。
雙相也不保證全面優於單相。若熱源分布、沸騰表面、液體充填量或冷凝能力沒有配合,可能出現乾涸、壓力波動或回流不均。部分雙相液體還涉及全球暖化潛勢、PFAS 法規與補充成本,因此必須查核所在地法規與冷卻液的完整生命週期資料。
用五個問題完成液冷選型
- 最高熱點在哪裡?若主要熱量集中在少數 CPU、GPU,冷板通常能直接處理;若大量元件都形成熱負載,浸沒式的整體接觸才更有價值。
- 是既有機房還是新建案?既有機房優先計算 CDU、管路和剩餘空調容量;新建案才有空間重新設計槽體、承載與維修動線。
- 硬體是否能標準化?多品牌、多世代且頻繁更換設備時,冷板生態通常較容易管理;浸沒式需要更嚴格的整機與液體相容清單。
- 團隊能否維護液體系統?確認水質或介電液監測、採樣、洩漏處理、備液、廢液及人員訓練,而不是只比較設備採購價。
- 故障時要多快恢復?把單台伺服器下架時間、備品取得、液體處理與重新上線步驟實際演練,再判斷哪一種架構符合服務等級。
完成這五項後,再比較設備成本、泵功、風扇功、設施改造與液體壽命,會比直接追求最低 PUE 或最高機櫃密度更可靠。
既有機房先看冷板,極高密度新建案再評估浸沒式
如果你的目標是在不中斷既有營運的前提下,逐步支援高功耗 CPU、GPU 或交換器,冷板液冷通常是比較務實的起點。它能集中處理主要熱源、保留機架式維修習慣,也比較容易用分區方式控制導入風險。
若是從零規劃的高密度運算中心,設備型號能標準化,而且你願意重新設計槽體、搬運、消防、液體管理與維修流程,浸沒式液冷才可能把風扇、空氣處理與環境限制一起拿掉。最終選擇不該只看冷卻能力,而要看哪套系統能在整個設備生命週期內穩定維護、快速復原並控制總成本。




