Files Slurm

Files standard

NomProcesseursCoeurs CPU par accountWalltimePartition
cpucourtIntel Xeon Gold 6248 (2×20 cœurs)28072 hpartagée
cpulongIntel Xeon Gold 6248 (2×20 cœurs)8014 jours (336 h)exclusive
amd AMD Epyc 7302 (2×16 cœurs)25696 hpartagée

Files basse priorité

Cliquez ici pour comprendre quand les utiliser.

NomProcesseursCoeurs CPU par accountWalltimePartition
amdcourt AMD Epyc 7302 (2×16 cœurs)51236 hpartagée

Files GPU / SMP

L’accès aux files GPU et/ou SMP n’est autorisé qu’à certains projets nécessitant du calcul GPU et/ou des noeuds à forte mémoire (après soumission d’une demande au comité scientifique).

NomCartes GPU par accountCoeurs CPU par accountWalltimePartition
gpu4 Tesla V1003236 hpartagée
smp7214 jours (336 h)partagée

Explications

Le nombre de coeurs CPU par account correspond au nombre maximal de coeurs que les membres d’un même account Slurm peuvent utiliser simultanément. Au-delà de cette limite, les jobs sont mis en attente.

Partition partagée ou exclusive :

  • partagée : vous réservez un certain nombre de coeurs sur un ou plusieurs noeuds. D’autres jobs que le vôtre peuvent tourner sur les coeurs restants de ce(s) noeud(s).
  • exclusive : vous réservez tous les coeurs d’un ou plusieurs noeuds. Aucun autre job ne tournera en même temps que le vôtre sur le(s) noeud(s) réservé(s). Cependant, même si votre job n’utilise pas tous les coeurs d’un même noeud, Slurm considèrera que vous avez consommé le temps écoulé pour le job fois le nombre total de coeurs réservés.

Walltime : temps maximal pendant lequel votre job peut tourner avant d’être automatiquement arrêté par Slurm.

Priorités des files AMD : voir cette page.

Points de reprise (checkpoints) fortement conseillés pour les jobs, en particulier les jobs longs. Voir par exemple DMTCP.

Des campagnes spécifiques ciblées (grands challenges, jobs longs de plus d’une semaine, …) pourront avoir lieu à certaines périodes de l’année, pour certains utilisateurs ou sur demande ponctuelle.