Ik bied AIops en SRE advies voor DevOps en cloud betrouwbaarheid

Sommige informatie is automatisch vertaald.

Verenigde Staten

Ik spreek Engels

GPU-infrastructuur LLMOps engineer NVIDIA Kubernetes Neo Cloud

Ik bouw schaalbare NVIDIA GPU-infrastructuur voor AI training en inference. Ik ben gespecialiseerd in Kubernetes GPU-clusters, LLM training/inference en GPU-observability. Diensten: • GPU cluster op...
Over deze dienst

Ben je bezig met het uitrollen van LLM-producten maar heb je moeite met GPU-infrastructuur, schaalbaarheid en betrouwbaarheid? Ik help teams bij het bouwen van productieklare GPU-platforms van begin tot eind.

Wat je krijgt: Neo cloud GPU setup en cluster hardening Kubernetes GPU scheduling en autoscaling voor LLM training en inference (vLLM/Ollama/Triton) MLOps/LLMOps CI/CD voor modellen en datastromen GPU monitoring en alerts met NVIDIA DCGM + Prometheus + Grafana Kostenoptimalisatie, capaciteitsplanning en best practices voor observability

De opleveringen kunnen onder meer een architectuuroverzicht, implementatieplan en praktische uitvoering omvatten, afhankelijk van het pakketniveau.

Tools:

Docker

GitLab

Jenkins

GitHub

CircleCI

Frameworks:

Terraform

Ansible

Cloudprovider:

Amazon Web Services

microsoft azure

Programmeertaal:

Bash

Python

Golang

Expertise:

Installatie

Migratie

Configuratie