Ik fine-tune LLM, train een op maat gemaakt AI-model en evalueer dataset
Ik maak AI-systemen die jouw bedrijfsvoering ondersteunen
Niveau 2
Voldoet aan hoge prestatiecriteria en heeft een bewezen staat van dienst in het voldoen aan de verwachtingen van de klant.
Over deze dienst
Generieke AI-modellen geven generieke antwoorden. Een model dat op jouw data is gefine-tuned spreekt jouw domein, volgt jouw formaat en kost een fractie van constante API-aanroepen. Ik fine-tune open source LLMs op jouw aangepaste data met volledige evaluatie, geen giswerk.
Wat ik lever:
- Fine-tune Llama, Mistral, Qwen, Gemma, Phi, DeepSeek en GPT-modellen
- LoRA en QLoRA fine-tuning voor efficiënte training op jouw taak
- Dataset voorbereiding, opschonen, deduplicatie, formaatconversie
- Instructie tuning, classificatie, domeinadaptatie, stijl matching
- Strenge evaluatie: nauwkeurigheid, perplexiteit, hallucinatiepercentage, aangepaste benchmarks
- Vergelijking met het basismodel zodat je de echte verbetering ziet
- Quantization (GGUF, GPTQ) voor goedkopere, snellere deployment
- Deployment begeleiding voor vLLM, Ollama, Hugging Face Endpoints
- Experiment tracking met Weights and Biases of MLflow
Stack: Python, PyTorch, Hugging Face Transformers, PEFT, TRL, LoRA, QLoRA, Unsloth, Axolotl, vLLM, Ollama, bitsandbytes.
Ik vertel je vooraf of fine-tuning überhaupt de juiste keuze is voor jouw use case of dat prompt engineering of RAG je beter en goedkoper kan helpen. Eerlijke scope, geen overdrijven.
Stuur me een bericht met jouw taak en dataset.
Programmeertaal:
Python
•
keras
•
Pytorch
•
R
•
Tensorflow
AI model frameworks en tools:
tensorflow
•
PyTorch
•
keras
Datatype:
Tekst
•
Afbeeldingen
•
Multimodal
Mijn portfolio
Andere Data science en ML diensten die ik aanbied
Veelgestelde vragen
Automatische vertaling
Heb ik echt fine-tuning nodig, of is RAG genoeg?
Eerlijk antwoord: veel use cases hebben geen fine-tuning nodig. Als je wilt dat het model feiten uit jouw documenten kent, is RAG meestal beter en goedkoper. Fine-tuning is geschikt wanneer je een specifiek outputformaat, een domeintoon, een classificatietaak of lagere inference kosten op schaal nodig hebt. Ik vertel je welke.
Welke modellen kun je fine-tunen?
Open source modellen: Llama, Mistral, Qwen, Gemma, Phi, DeepSeek en anderen op Hugging Face. Ik kan ook OpenAI modellen (GPT) fine-tunen via hun fine tuning API. Ik adviseer het beste basismodel voor jouw taak, budget en deployment doel.
Hoeveel data heb ik nodig voor fine-tuning?
Het hangt af van de taak. Stijl- of formaatmatching kan met enkele honderden goede voorbeelden. Domeinadaptatie of classificatie vereist meestal 1.000 tot 10.000+ voorbeelden. Kwaliteit is belangrijker dan kwantiteit. Als je niet genoeg data hebt, help ik je met het maken of uitbreiden van een dataset (beschikbaar als extra).
Wordt het fine-tuned model beter dan GPT-4?
Niet op algemeen intelligentieniveau. Een fine-tuned klein model wint op een specifieke taak: jouw formaat, jouw domein, lagere kosten, snellere snelheid en volledige dataprivacy omdat het op jouw hardware draait. Ik benchmark altijd het fine-tuned model tegen het basismodel en een krachtig API-model zodat je de r
Bied je evaluatie, niet alleen training?
Ja, en dat onderscheidt een echte fine-tune van giswerk. Standaard en Premium omvatten evaluatie: nauwkeurigheid, perplexiteit, hallucinatiepercentage en een vergelijking met het basismodel. Premium voegt een aangepaste benchmark toe gebaseerd op jouw echte use cases zodat je zeker weet dat het model echt werkt voordat je d
Wie betaalt de GPU- en rekenkosten?
Rekenkosten (GPU-huur op Colab, RunPod, Vast of cloud) zijn los van mijn servicekosten, meestal tussen $5 en $50 afhankelijk van modelgrootte en dataset. Ik schat dit vooraf zodat je niet voor verrassingen komt te staan. Voor kleine modellen zijn de kosten minimaal. Ik optimaliseer training om rekenkosten laag te houden.
Kan ik het fine-tuned model daarna zelf draaien?
Ja. Jij bezit de modelgewichten en de code. Premium bevat een deployment gids voor vLLM, Ollama of Hugging Face Endpoints, plus quantization (GGUF, GPTQ) zodat het goedkoop draait op bescheiden hardware. Je bent nooit afhankelijk van mij voor inference.
Wat heb je van mij nodig om te beginnen?
Jouw dataset (of een beschrijving zodat ik kan helpen er een te bouwen), de taak die je wilt dat het model uitvoert, en je deployment doel (cloud, lokaal, edge). API documentatie of voorbeelden van het ideale output helpen enorm. Ik verzorg de training, evaluatie en levering.

