Comment l'optimisation de l'IA affecte la conception du centre de données
par Colin Ryan
il y a 2 jours
Tate Cantrell. Image : Pawel Swider
Tate Cantrell de Verne Global discute des implications de l'IA sur la conception des centres de données, des exigences complexes en matière de refroidissement aux protocoles de sécurité de niveau OTAN.
Récemment, Meta a partagé les détails de ses projets d'amélioration de l'IA, qui comprenaient une conception de centre de données optimisée pour l'IA, déclarant que la nouvelle conception prendra en charge « du matériel d'IA refroidi par liquide et un réseau d'IA hautes performances connectant des milliers de puces d'IA pour le centre de données ». clusters de formation en IA à grande échelle ».
La société a également déclaré que la nouvelle conception serait plus rapide et plus rentable à construire. Mais comment l’optimisation de l’IA affecte-t-elle réellement les subtilités de la conception des centres de données ?
Pour le savoir, nous avons discuté avec Tate Cantrell, directeur de la technologie chez Verne Global, qui nous a donné un aperçu des nombreuses façons dont la conception des centres de données change pour s'adapter à l'opérabilité appropriée de l'IA.
« La conception d'un centre de données est une tâche complexe qui consiste à équilibrer la demande d'énergie, les besoins en refroidissement, la haute sécurité, les niveaux extrêmes de fiabilité et l'accès à haut débit aux réseaux », a déclaré Cantrell.
« Les modèles d’IA nécessitent une intensité et une densité de calcul bien plus élevées, ajoutant une nouvelle dimension de complexité aux défis de la conception traditionnelle des centres de données. »
Selon Cantrell, certains des paramètres fondamentaux affectés par l'hébergement de modèles d'IA sont la source d'alimentation et la fiabilité ; le besoin de racks de serveurs à plus haute densité ; et l'évolutivité.
« Un centre de données traditionnel qui n'est pas conçu pour ces conditions extrêmes ne sera pas en mesure de fournir des performances fiables. En fin de compte, le secteur des centres de données a besoin d’une conception modifiée des centres de données s’il veut suivre le rythme des exigences de la technologie de l’IA.
Mais pourquoi les modèles d’IA ont-ils besoin d’un calcul haute densité ? Cantrell a déclaré que c'était parce que l'informatique IA nécessite « des connexions réseau à latence extrêmement faible entre les serveurs du centre de données ».
« Il y a quelques années, la densité moyenne des racks était de 5 kW par rack. Mais la dernière génération de supercalculateurs d’IA exige bien plus de la part de l’infrastructure des centres de données.
« Seulement quatre de ces systèmes dans un rack pourraient consommer plus de 40 kW tout en n'occupant que 60 % de l'espace d'un rack informatique classique. Ainsi, si les centres de données veulent gérer efficacement le matériel d’IA, ils devront être capables de ce type de calcul haute densité.
Selon Cantrell, la plupart des centres de données conventionnels ne sont pas équipés pour gérer « l’énorme » calcul requis pour entraîner les réseaux neuronaux d’IA, notamment en termes de refroidissement.
Alors que les centres de données traditionnels s'appuient sur des racks de serveurs largement espacés pour faciliter le refroidissement, les applications d'apprentissage automatique nécessitent des racks rapprochés, car cela optimise la latence et la capacité de bande passante entre les serveurs, tout en minimisant le coût global de déploiement.
« Pour ajouter à la complexité, les systèmes refroidis par air qui sont trop rapprochés peuvent entraîner des défauts de refroidissement, car les exigences extrêmes en matière de flux d'air des serveurs de grande capacité peuvent souffler les uns contre les autres et créer une contre-pression sur les ventilateurs de refroidissement de l'équipement », Cantrell ajoutée.
« Les centres de données doivent donc équilibrer les pressions financières liées à la réduction de l'empreinte du data hall avec la nécessité de fournir suffisamment d'espace pour un refroidissement adéquat.
"C'est l'une des raisons pour lesquelles nous constatons une accélération de l'adoption croissante du refroidissement liquide."
Comme si les exigences complexes en matière de refroidissement ne suffisaient pas, Cantrell affirme que les centres de données devront également être « structurellement capables de gérer des équipements lourds » pour permettre le déplacement d'armoires informatiques lourdes pour l'IA, qui pourraient peser plus de 1,5 tonne une fois entièrement configurées.
« L'IA elle-même a également un rôle à jouer en matière de sécurité des centres de données »
Cantrell affirme que l'infrastructure des centres de données doit être capable de répondre aux exigences de « connectivité, d'agilité et d'évolutivité » afin de pouvoir héberger et analyser les ensembles de données de plus en plus volumineux sur lesquels les modèles d'IA sont formés.