La comunicazione e la condivisione promuovono la crescita
Uniamo le forze per lo sviluppo
Nel corso di decenni di sviluppo dei data center, il raffreddamento ad aria è rimasto la scelta predominante. Tuttavia, il lancio della serie GB200 di NVIDIA sta infrangendo completamente questo equilibrio. Quando la densità computazionale raggiunge nuove vette, i metodi di raffreddamento tradizionali non sono più in grado di soddisfare la domanda, e la tecnologia a liquido emerge ufficialmente dalle quinte per diventare un'infrastruttura chiave a supporto della potenza di calcolo AI.
1- Un cambiamento fondamentale dal lato della domanda
a. Superamento del punto critico di densità di potenza
La densità di potenza del rack GB200 NVL72 si prevede supererà i 30 kW per rack, una cifra che va ben oltre il limite di dissipazione di 15-20 kW della tecnologia tradizionale ad aria. Ciò significa:
· Scelta obbligata del percorso tecnologico: Il raffreddamento a liquido passa da "opzione da considerare" a "unica scelta possibile".
· Cambiamento qualitativo dello spazio di mercato: Ogni implementazione GB200 implica una domanda certa di raffreddamento a liquido.
· Aumento significativo del valore: Il valore del sistema di raffreddamento a liquido per un singolo rack raggiunge le centinaia di migliaia di RMB.
b. Aggiornamento dei requisiti di affidabilità
Con l'aumento della densità di potenza di calcolo per rack, anche il valore aziendale che supporta cresce in modo esponenziale. L'affidabilità del sistema a liquido è direttamente correlata a:
· Continuità operativa: Un singolo guasto di raffreddamento può causare una perdita di potenza di calcolo per milioni.
· Durata del sistema: Per ogni aumento di 10°C nella temperatura, la durata dei componenti elettronici si dimezza.
· Stabilità delle prestazioni: L'efficienza di raffreddamento influisce direttamente sulla capacità del chip di mantenere costantemente le prestazioni di picco.
2- Miglioramento completo dei requisiti tecnici
a. Esigenza di un salto nell'efficienza di raffreddamento
Il GB200 impone requisiti senza precedenti al sistema di raffreddamento:
· Raddoppio delle prestazioni di conduzione termica
· La conduttività termica della piastra fredda deve essere 3-5 volte superiore rispetto alle soluzioni tradizionali
· La resistenza termica di contatto deve essere ridotta di un ordine di grandezza
Figura 1 - Piastra di raffreddamento a liquido a microcanali
b. Controllo di precisione della portata
· Necessità di raggiungere una precisione di controllo della portata entro ±1%
· Supporto alla regolazione dinamica della portata per adattarsi a diverse condizioni di carico
c. Uniformità della temperatura
· La differenza di temperatura sulla superficie del chip deve essere controllata entro 5°C
· Evitare punti caldi locali che compromettano la stabilità del sistema
3- Balzo nella complessità dell'integrazione di sistema
Il sistema di raffreddamento a liquido si è evoluto da una semplice fornitura di componenti a un complesso progetto ingegneristico di sistema:
a. Modalità tradizionale:
· Fornitura di piastre fredde standardizzate
· Connessioni di tubazioni semplici
· Funzionalità di monitoraggio di base
b. Era GB200:
· Progettazione dell'architettura di raffreddamento a liquido a livello rack
· Sistema intelligente di distribuzione della portata
· Monitoraggio in tempo reale dello stato di salute
· Capacità di manutenzione predittiva
Figura 2 - Rack NVIDIA GB200
4- Elevazione completa delle barriere competitive
Nel nuovo contesto di mercato, le aziende devono superare soglie più elevate:
a. Barriera tecnologica
Le aziende di raffreddamento a liquido devono superare i limiti di singole discipline, costruendo un sistema tecnologico integrato e multidisciplinare. La profonda integrazione di tecnologie come la progettazione di microcanali, la scienza dei materiali e la fluidodinamica diventa il requisito di base, mentre la capacità di simulazione e ottimizzazione termica a livello chip mette alla prova l'accumulo tecnologico profondo dell'azienda. Questa non è più un semplice miglioramento di processo, ma un progetto sistemico che richiede investimenti in R&S a lungo termine.
b. Barriera di certificazione
Il sistema di certificazione del settore sta diventando sempre più rigoroso. Le aziende non solo devono superare i severi test di affidabilità stabiliti dai produttori di server, ma devono anche ottenere la certificazione tecnica del produttore di chip originale. Questo doppio requisito di certificazione non solo verifica le prestazioni tecniche del prodotto, ma mette anche alla prova il sistema di qualità e la capacità di fornitura stabile e continua dell'azienda, diventando un passaggio obbligatorio per accedere alla supply chain core.
c. Barriera dei servizi
Con l'evoluzione dei sistemi a liquido in sottosistemi core, la capacità di servizio è diventata un fattore competitivo chiave. Le aziende devono stabilire una rete di risposta rapida a copertura nazionale e costruire un sistema professionale di operazioni e manutenzione 24/7. Questa capacità di servizio richiede non solo tempestività nel supporto tecnico, ma soluzioni complete di servizio che includano manutenzione preventiva e gestione delle emergenze, diventando veramente un partner affidabile per il cliente.
Condivideremo regolarmente aggiornamenti e informazioni su tecniche di progettazione termica e alleggerimento, per la vostra consultazione. Grazie per l'interesse verso Walmate.