麥肯錫預(yù)測,到2030年,支持人工智能的數(shù)據(jù)中心容量將以每年33%的速度增長。國際能源署警告稱,到2020年,數(shù)據(jù)中心的電力需求可能會增加一倍以上。美國電力研究院(EPRI)最近的研究揭示了一個更為顯著的變化:機架密度將從8-40千瓦躍升至130-600千瓦,預(yù)計到2028年每個機架的功率將達到1.2兆瓦。
2025年9月5日
圖形處理單元 (GPU) 集群的耗電量如今堪比一座小城市,有些集群僅僅訓(xùn)練一個模型就耗電100兆瓦時。人工智能的蓬勃發(fā)展迫使數(shù)據(jù)中心面臨傳統(tǒng)系統(tǒng)無法應(yīng)對的需求。
麥肯錫預(yù)測,到2030年,支持人工智能的數(shù)據(jù)中心容量將以每年33%的速度增長。國際能源署警告稱,到2020年,數(shù)據(jù)中心的電力需求可能會翻一番以上。美國電力研究院 (EPRI) 最近的研究揭示了一個更為顯著的變化:機架密度從8-40千瓦躍升至130-600千瓦,預(yù)計到2028年每機架的耗電量將達到1.2兆瓦。正如NVIDIA的黃仁勛所說:“如果你的電力有限,你的收入也會受到限制。”
理解人工智能工廠:訓(xùn)練 vs 推理
并非所有人工智能設(shè)施都生而平等。人工智能訓(xùn)練數(shù)據(jù)中心,真正的“模型創(chuàng)建人工智能工廠”,運行著持續(xù)的高功耗工作負載,將散熱系統(tǒng)推向極限。這些設(shè)施創(chuàng)建了驅(qū)動 AI 應(yīng)用的大型語言模型 (LLM)。
AI推理數(shù)據(jù)中心則服務(wù)于不同的目的。這些“AI 部署工廠”處理實時用戶交互——想想您使用 Copilot 或 ChatGPT 時的情況。它們面臨著不可預(yù)測的使用高峰,同時保持全球用戶群的即時響應(yīng)時間。
行業(yè)需要能夠?qū)崟r適應(yīng)變化的 AI 負載的動態(tài)熱管理系統(tǒng)。
地理位置也很重要。行業(yè)趨勢表明,推理設(shè)施的全球分布不均衡,亞太地區(qū)等地區(qū)與成熟市場相比可能服務(wù)不足,導(dǎo)致用戶的性能差異。這種不平衡正在推動全球快速擴張,隨著 AI 代幣價格下降,行業(yè)專家預(yù)測,需要推理能力更靠近用戶的新應(yīng)用將激增。這需要能夠適應(yīng)不同氣候和條件的適應(yīng)性設(shè)施。對于數(shù)據(jù)中心而言,寒冷氣候和溫暖氣候之間的差異可能巨大——寒冷的國家可以利用自然冷卻,而溫暖的國家可能需要大規(guī)模的冷卻系統(tǒng)。
真正的挑戰(zhàn):熱量和多變性
AI 工作負載不僅消耗更多電力,還會帶來全新的運營挑戰(zhàn)。與負載可預(yù)測的傳統(tǒng)應(yīng)用不同,人工智能會產(chǎn)生突發(fā)的功率峰值和強烈的熱量爆發(fā),這可能會使傳統(tǒng)的冷卻系統(tǒng)不堪重負。現(xiàn)代人工智能芯片運行時溫度更高、密度更高,這帶來了嚴峻的熱管理挑戰(zhàn),迫使冷卻系統(tǒng)達到極限。
這不僅僅是為了管理更高的基準(zhǔn)功耗,而是為了構(gòu)建能夠?qū)崟r適應(yīng)工作負載在幾毫秒內(nèi)從中等強度過渡到最大強度的系統(tǒng)。為穩(wěn)定狀態(tài)操作而設(shè)計的傳統(tǒng)冷卻方法根本無法適應(yīng)這種變化。
可持續(xù)發(fā)展的風(fēng)險同樣很高。麥肯錫的研究表明,人工智能基礎(chǔ)設(shè)施的增長速度可能超過脫碳努力的速度,從而危及凈零目標(biāo)。國際能源署預(yù)測,到 2030 年,針對人工智能優(yōu)化的數(shù)據(jù)中心所消耗的電力可能比日本目前全國的用電量還要多。
前進的道路:人工智能的自適應(yīng)基礎(chǔ)設(shè)施
該行業(yè)需要能夠?qū)崟r適應(yīng)變化的人工智能負載的動態(tài)熱管理系統(tǒng)。這意味著將智能控制、預(yù)測分析和自適應(yīng)冷卻技術(shù)嵌入到每個運營層。成功需要能夠跨地域一致運行、適應(yīng)當(dāng)?shù)貤l件且不影響性能的解決方案。
江森自控數(shù)據(jù)中心解決方案全球產(chǎn)品組合總監(jiān) Davin S. Sandhu 表示:“該行業(yè)非常了解如何在低密度和中密度場景下散熱。但隨著機架密度不斷增加,您就必須開始討論和溝通您是否擁有合適的熱管理解決方案。”
“這時,擁有一個了解這些不同的熱管理挑戰(zhàn)和系統(tǒng)需求的合作伙伴就變得至關(guān)重要,這樣您不僅能在當(dāng)下取得成功,還能為未來做好準(zhǔn)備。”
企業(yè)需要既了解技術(shù)復(fù)雜性又了解戰(zhàn)略要務(wù)的合作伙伴。人工智能革命正在提高數(shù)據(jù)中心生態(tài)系統(tǒng)中每個人的風(fēng)險,但它也為更智能、更可持續(xù)、更高效的基礎(chǔ)設(shè)施開辟了非凡的可能性。
那些能夠憑借合適的技術(shù)專長和戰(zhàn)略合作伙伴解決這些復(fù)雜性的公司,才能脫穎而出。問題不在于我們是否準(zhǔn)備好了,而在于我們是否會選擇能夠適應(yīng)、擴展并滿足未來性能要求的解決方案。
準(zhǔn)備好讓您的人工智能基礎(chǔ)設(shè)施面向未來了嗎?與江森自控合作,共同應(yīng)對人工智能就緒數(shù)據(jù)中心的復(fù)雜性,從而保持效率和可持續(xù)性。
IOL觀察
IOL刊物
數(shù)據(jù)云倉
報告
冷暖智造
