Mise à jour du calculateur « osaka »

Les évolutions sont les suivantes :

  1. Evolutions logicielles :
    • Réinstallation complète du cluster sous un nouveau système d’exploitation : passage de Linux CentOS 7.9 à Linux RHEL 9.4,
    • Remplacement de « environment-module » par « Lmod » (commande module),
    • Réorganisation des modules logiciels : entrées par application, éditeur, utilitaires, langages et compilateurs,
    • Mise à jour du système de batch Altair Grid Engine (AGE),
    • Montée de version de tous les logiciels, compilateurs et bibliothèques,
    • Remplacement de « x2go » par « ThinLinc » pour l’accès à son bureau graphique distant sur un frontal,
  2. Evolutions de l’hébergement des données :
    • Suppression des pools de stockage chaud (« home ») et de stockage froid (« archives »),
    • Ajout d’un cluster de stockage distribué BeeGFS avec un seul pool, d’une capacité utile de 437 Tio,
  3. Evolutions matérielles sur les noeuds :
    • Suppression des nœuds 25 à 60 (noeuds du pool Infiniband QDR),
    • Ajout de 11 nœuds de type Apollo 2000, identiques aux nœuds hdr01 à hdr15,
    • Ajout d’un second frontal au cluster dédié à la visualisation graphique (bureau graphique distant, applications graphiques lourdes),
    • Remplacement du nœud de virtualisation hébergeant les serveurs de pilotage du calculateur,
  4. Evolutions matérielles sur les réseaux :
    • Changement complet du réseau Ethernet interne pour une interconnexion des noeuds homogène en 10 Gb/s,
    • Suppression du réseau Infiniband QDR (40 Gb/s),
    • Interconnexion haut débit des noeuds par un réseau Infiniband EDR / HDR100 (100 Gb/s).

Une réorganisation de l’hébergement des serveurs du calculateur dans le datacenter de Lognes a également été opérée.

Gestion de vos demandes d’assistance

Nous recevons un grand nombre de messages sur nos messageries professionnelles. Afin d’assurer un meilleur suivi de vos demandes, nous ne traiterons que les demandes adressées soit via la plate-forme d’assistance soit via la hotline.

Toutes vos demandes doivent être adressées :

Merci pour votre compréhension.

Ajout de 13 nouveaux noeuds

Mise en service de treize nouveaux noeuds HPE XL220n Gen10+ (dans 3 chassis Apollo 2000). Caracteristiques principales de ces nouveaux noeuds : 2 x (26 coeurs avec 256 Go de RAM).

Le nom de ces noeuds est sous la forme hdrXX-osaka. Ils utilisent la technologie réseau haut debit Infiniband HDR-100. L’HDR-100 est compatible, de même débit et connecté à la technologie réseau Infiniband EDR : ces noeuds sont donc intégrés au pool IB EDR. Un job parallèle distribué peut donc s’executer sur des noeuds EDR et HDR au sein du même job.

Cet ajout vous permet de benéficier de 676 coeurs de calcul et ~7 To de mémoire supplémentaires. La puissance crète d’osaka passe ainsi de ~40 TFlops a ~64 TFlops, soit une augmentation de ~60%.

Deux équipes ont financé 6 de ces nouveaux noeuds. L’usage de ces 6 noeuds leur ai réservé.

Réouverture de l’accès au cluster « Osaka »

L’ensemble des éléments hardware du serveur de calcul Osaka ont été déménagés dans un data-center localisé à Lognes. Osaka a été stoppé le jeudi 28 juillet pour démontage. Les éléments ont été déplacés et remontés durant la première semaine d’aout. La seconde semaine d’aout a été consacrée à des mises à jours de l’ensemble des firmwares et drivers, la connexion à des volumes d’un nouveau NAS, ainsi qu’à la mise en place d’un système de management à distance (Lognes n’est pas ce que l’on peut appeler la porte à coté). Vous constaterez également que nous avons retiré du cluster certains vieux nœuds, qui présentaient des dysfonctionnements.

Toutes ces opérations sont transparentes pour les utilisateurs et le fonctionnement du cluster n’a pas changé.