
當 AI 伺服器從數百顆 GPU 擴大到數萬顆,運算能力不再是唯一瓶頸。大量資料必須在 GPU、交換器與機櫃之間移動,如果每一個高速通道都要經過較長的電路板走線,訊號損耗、功耗與散熱都會跟著上升。
CPO(Co-Packaged Optics,共同封裝光學)就是把光學引擎移到交換器 ASIC 附近,縮短高速電訊號的傳輸距離,再由光纖把資料送出設備。它不是單純把光模組縮小,而是重新安排晶片、光學元件、封裝、供電、散熱與維修方式。本文將從訊號路徑開始,說明 CPO 為什麼出現、與可插拔光模組差在哪裡,以及量產前還要解決哪些工程問題。
CPO 是什麼?核心改變在訊號路徑
CPO 是將交換器 ASIC 與一個或多個光學引擎整合在同一載板或緊密封裝平台上的架構。光學引擎內通常包含調變器、光偵測器、驅動器、跨阻放大器與光纖耦合結構;實際組成會依產品與封裝方式不同。
傳統可插拔光模組位於設備面板,交換器 ASIC 的高速電訊號必須先穿過封裝接點、印刷電路板與連接器,才會到達光模組。資料速率提高後,這段銅走線需要更複雜的等化、重定時與訊號補償。CPO 把光電轉換移到 ASIC 周圍,讓高頻電訊號只走一小段距離,長距離傳輸改由光纖負責。
這種做法屬於異質整合的一部分。若要先理解晶片堆疊、載板與互連關係,可以參考高密度 IC 封裝技術的結構差異.
CPO 如何把電訊號轉成光訊號?
一筆資料從交換器送出時,大致會經過以下流程:
- 交換器 ASIC 透過 SerDes(Serializer/Deserializer,序列器/解序列器)輸出高速電訊號。
- 鄰近的光學引擎接收電訊號,驅動調變器改變光的強度或相位。
- 調變後的光耦合進光纖,傳送到另一台交換器、伺服器或機櫃。
- 接收端的光偵測器把光訊號轉回電訊號,再交給 ASIC 處理。
關鍵不在於「用光取代所有電路」,而是讓電訊號只負責封裝內或封裝附近的短距離互連。供電、控制與部分管理訊號仍然需要電路,光纖也必須經過精密對準與固定,才能維持低耦合損耗。
OIF 在 2023 年發布的3.2 Tb/s CPO 模組實作協議,定義了 8 組 400 Gb/s 光介面選項、32 條 CEI-112G-XSR 主機介面,以及光機構、電氣與管理介面。這代表 CPO 不只是概念展示,產業也在建立多供應商互通所需的邊界條件。
CPO 與可插拔光模組差在哪裡?
| 比較項目 | 可插拔光模組 | CPO 共同封裝光學 |
|---|---|---|
| 光電轉換位置 | 設備前面板 | 交換器 ASIC 附近 |
| 高速電訊號距離 | 較長,需穿過電路板與連接器 | 較短,主要在封裝附近 |
| 維修方式 | 單一模組可直接抽換 | 可能牽涉光引擎、封裝或整機維修 |
| 面板配置 | 受模組尺寸與散熱空間限制 | 可把更多面板空間留給光纖連接 |
| 熱設計 | 模組與 ASIC 熱源較分散 | 光學元件靠近高功耗 ASIC,熱耦合更強 |
| 供應鏈成熟度 | 介面成熟、供應商多 | 封裝、光纖耦合與測試仍在整合 |
CPO 的主要收益是縮短高速電通道,而可插拔模組的優勢是維修彈性與成熟供應鏈。因此兩者不是單純的新舊世代關係。當設備頻寬尚未逼近電路板走線與面板密度極限時,可插拔方案通常仍有成本與營運優勢。
CPO 為什麼適合 AI 資料中心?
AI 訓練需要大量 GPU 同步交換資料,交換器的總頻寬、每埠速率與能源效率會直接影響叢集規模。頻寬提高時,如果電通道補償功耗也同步增加,整座資料中心不只要付出用電成本,冷卻系統還要把這些熱帶走。
這也是 CPO 最受關注的場景:它可降低高速電通道的損耗與面板密度壓力,讓交換器朝更高總吞吐量發展。不過,節能幅度取決於 ASIC、SerDes、光引擎、冷卻與網路拓撲,不能用單一數字代表所有產品。
例如 NVIDIA 在 2025 年的Spectrum-X Photonics 官方公告中,宣稱其矽光子交換器相較傳統方案可達 3.5 倍能源效率,並列出 100 Tb/s 與 400 Tb/s 的交換器配置。這是特定廠商與系統條件下的產品數據,適合用來觀察產業方向,不應直接套用到其他 CPO 架構。
評估資料中心效益時,還要同時看 TDP、冷卻耗能與 PUE。可延伸閱讀TDP 與 PUE 的散熱需求判讀方式,避免只看交換器晶片的標稱功耗。
共同封裝不代表雷射一定放在晶片旁
雷射對溫度與可靠度敏感,而交換器 ASIC 正是系統內的高熱通量區域。因此有些 CPO 架構把調變器與光偵測器放在 ASIC 周圍,雷射光源則留在前面板,透過光纖把連續光送進光學引擎。
OIF 的ELSFP 外置雷射實作協議,便將雷射安排在較冷的前面板,並支援熱插拔更換。這能降低雷射受到 ASIC 熱源影響的風險,也讓失效光源不必連同整個交換器封裝一起報廢。
不過,外置雷射會增加光纖路由、連接器、功率分配與眼睛安全設計。換句話說,CPO 解決了長距離電互連問題,卻把部分複雜度轉移到光機構整合與系統管理。
CPO 量產最難的四個問題
1. 散熱與溫度分布
ASIC、驅動器與光學元件被放得更近,局部熱點會影響雷射波長、調變器效率與光偵測器雜訊。熱設計不能只看總功耗,還要看熱源位置、封裝熱阻、冷板接觸面與冷卻液路徑。若系統採液冷,水冷板流道與壓降的選型條件也會影響可維修性與泵浦功耗。
2. 良率與已知良品整合
一個 CPO 封裝可能同時包含高價 ASIC、多顆光學引擎、電子晶粒與精密光纖介面。任何一個元件或耦合點失效,都可能拉低整體封裝良率。因此晶圓級測試、已知良品(Known Good Die)篩選與封裝後測試必須在設計初期一起規劃。
3. 光纖耦合與組裝公差
光纖與矽光子元件的對準誤差通常會直接反映在插入損耗。量產線必須兼顧微米級對準、黏著劑固化、熱膨脹與長期可靠度;實驗室能工作的樣品,不代表能以合理節拍大量製造。
4. 維修與故障隔離
可插拔模組故障時,現場人員可直接抽換單一模組。CPO 若缺乏模組化設計,光引擎故障可能需要更換交換器托盤甚至整個系統。監控介面必須能分辨雷射、光路、光引擎、ASIC 通道與連接器故障,否則節省的功耗可能被停機與備品成本抵銷。
CPO 會全面取代可插拔光模組嗎?
短期內不太可能。CPO 最適合高埠數、高總頻寬、功耗與面板密度都接近極限的交換器;對頻寬較低、需要頻繁升級模組,或重視現場快速維修的設備,可插拔光模組仍然合理。
實務上還可能出現多種共存方案:部分高速埠採 CPO,較低速或長距離介面維持可插拔;也可能使用線性可插拔光學(LPO)降低模組內數位訊號處理功耗。選型時應比較整機能源、設備成本、維修時間、備品策略與供應商互通性,而不是只比較單一埠的功耗。
結語:先看系統條件,再判斷是否需要 CPO
CPO 的本質,是把最難傳的高速電訊號縮短,讓光纖更早接手長距離資料傳輸。它能改善交換器頻寬密度與能源效率的上限,但同時把散熱、光纖耦合、封裝良率與維修責任集中到更複雜的系統中。
評估 CPO 時,可以依序問四個問題:現有電通道是否已成為頻寬或功耗瓶頸?整機冷卻能否控制光學元件溫度?故障時能更換到哪一層?供應商是否遵循可互通的光學、電氣與管理介面?只有當這些答案都能被量測與維護,CPO 才不只是規格表上的高速方案,而是能真正落地的資料中心架構。





