Ik bied AIops en SRE advies voor DevOps en cloud betrouwbaarheid
GPU-infrastructuur LLMOps engineer NVIDIA Kubernetes Neo Cloud
Over deze dienst
Ben je bezig met het uitrollen van LLM-producten maar heb je moeite met GPU-infrastructuur, schaalbaarheid en betrouwbaarheid? Ik help teams bij het bouwen van productieklare GPU-platforms van begin tot eind.
Wat je krijgt: Neo cloud GPU setup en cluster hardening Kubernetes GPU scheduling en autoscaling voor LLM training en inference (vLLM/Ollama/Triton) MLOps/LLMOps CI/CD voor modellen en datastromen GPU monitoring en alerts met NVIDIA DCGM + Prometheus + Grafana Kostenoptimalisatie, capaciteitsplanning en best practices voor observability
De opleveringen kunnen onder meer een architectuuroverzicht, implementatieplan en praktische uitvoering omvatten, afhankelijk van het pakketniveau.
Tools:
Docker
•
GitLab
•
Jenkins
•
GitHub
•
CircleCI
Frameworks:
Terraform
•
Ansible
Programmeertaal:
Bash
•
Python
•
Golang
Expertise:
Installatie
•
Migratie
•
Configuratie
