Ik zet een linux hpc cluster op met openhpc, slurm en infiniband
Over deze dienst
Een HPC cluster vanaf het begin correct opzetten bespaart maanden debuggen en voorkomt de configuratielast die 80% van de prestatieproblemen van clusters later veroorzaakt.
Ik heb HPC clusters ontwikkeld van 4 tot 600 nodes onder India's National Supercomputing Mission, van bare metal tot HPL-acceptatie.
De volledige stack waarmee ik werk:
Provisioning: Warewulf 4, xCAT, PXE
OS: Rocky Linux 8/9, AlmaLinux, CentOS Stream
Scheduler: Slurm met volledige accounting en cgroup
MPI: OpenMPI, IntelMPI, MVAPICH2
Fabric: InfiniBand HDR/NDR/EDR, Ethernet RDMA
Opslag: Lustre, BeeGFS, GPFS, NFS
Monitoring: Grafana, Prometheus, Ganglia
Wat je ontvangt:
Volledig geprovisioneerde compute nodes
Werkende Slurm wachtrij met geteste jobs
InfiniBand fabric gevalideerd met ibdiagnet
MPI hello world en bandbreedtetest geslaagd
Complete configuratiedocumentatie
Overdrachtsgesprek om je door het systeem te leiden
Voor je bestelt: stuur me een bericht met je node-aantal, hardware specificaties en welke workloads je wilt draaien. Ik bevestig de haalbaarheid en planning voordat je betaalt.
Server:
Overige
Besturingssysteem:
Linux
