Ik review, debug en verbeter je python machine learning code
Over deze dienst
Werken je machine learning modellen niet goed, geven ze fouten of zijn ze gewoon moeilijk te begrijpen? Ik help je dat op te lossen.
Ik ben een Senior Data Scientist bij een bank met meer dan 3 jaar ervaring in productie ML, een First Class CS-diploma en ik volg momenteel een MSc in Bioinformatica. Ik heb echte ML-modellen gebouwd, gedebugd en geoptimaliseerd op schaal, niet alleen speelgoedprojecten.
Wat ik kan reviewen en oplossen:
- Scikit-learn en PyTorch pipelines en modellen
- Pandas data preprocessing en feature engineering
- Modeltraining, evaluatie en hyperparameterlogica
- Code structuur, efficiëntie en best practices
- NumPy, XGBoost, PyTorch en algemeen Python ML code
Wat je terugkrijgt:
- Correcte, schone Python scripts
- Een geschreven rapport waarin elk gevonden probleem en de oplossing worden uitgelegd
- Optimalisatie suggesties om snelheid en nauwkeurigheid te verbeteren
- Een aangepaste evaluatiescript die belangrijke metrics output
- Model documentatie met inputs, outputs, aannames en beperkingen
Om te beginnen, stuur me:
- Je Python script(s) als .py of .ipynb bestanden
- Een korte beschrijving van wat de code moet doen
- Eventuele foutmeldingen of specifieke problemen die je hebt opgemerkt
Ik reageer binnen 24 uur op alle berichten. Laten we je code goed laten werken.
Programmeertaal:
Python
Frameworks:
Scikit-learn
•
PyTorch
•
Panda
Tools:
Jupyter-notitieboek
•
tensorflow
•
Excel
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Met welke soorten machine learning problemen kan ik je helpen?
Ik kan helpen met classificatie, regressie, clustering en neurale netwerkmodellen. Ik werk met Scikit-learn, PyTorch, XGBoost en algemeen Python ML code met Pandas en NumPy. Als je niet zeker weet of je project erbij past, stuur me dan een bericht voordat je bestelt.
Welke bestandsformaten accepteert u?
Ik accepteer .py Python scripts en .ipynb Jupyter notebooks. Als je project meerdere bestanden heeft, zip ze dan en stuur ze als één archief. Voeg ook eventuele CSV- of datadocumenten toe waarop de code afhankelijk is, of een kleine sample ervan.
Wat als ik niet weet wat er mis is met mijn code, ik weet alleen dat het niet werkt?
Dat is helemaal prima en, in feite, de meest voorkomende situatie. Beschrijf gewoon wat de code moet doen en wat er in plaats daarvan gebeurt. Ik diagnoseer het probleem als onderdeel van de review.
Deel je mijn code of gebruik je die voor andere doeleinden?
Nee. Je code is volledig vertrouwelijk. Ik gebruik het alleen om je opdracht te voltooien en het wordt niet gedeeld, opgeslagen of hergebruikt op enige manier.
Hoe weet ik welk pakket ik moet kiezen?
Kies Basic als je een review en fix van 1-2 scripts nodig hebt. Kies Standard als je tot 3 scripts hebt en optimalisatie bovenop fixes wilt. Kies Premium als je een volledig project hebt van tot 5 scripts en een evaluatiescript en model documentatie inclusief wilt.
Wat is het evaluatiescript dat in Premium is inbegrepen?
Het is een standalone Python script dat op jouw model is afgestemd en dat je kunt uitvoeren na elke retraining. Het laadt automatisch je model, voert voorspellingen uit op testdata en geeft belangrijke prestatie metrics weer. Resultaten worden ook opgeslagen in een logbestand met een timestamp zodat je prestaties in de loop van de tijd kunt volgen.
Garandeer je dat mijn model na de review nauwkeuriger wordt?
Ik kan bugs oplossen, datalekken verwijderen, preprocessing verbeteren en betere hyperparameters of algoritmes voorstellen, wat meestal de prestaties verbetert. Maar verbeteringen in nauwkeurigheid hangen sterk af van de kwaliteit van je data en de complexiteit van het probleem, dus ik kan dat niet garanderen.
Wat als ik na de bevalling wijzigingen wil aanbrengen?
Elk pakket bevat revisies: 1 voor Basic, 2 voor Standard en 3 voor Premium. Revisies omvatten aanpassingen aan het werk dat al is geleverd. Als je iets buiten de oorspronkelijke scope nodig hebt, kunnen we dat bespreken als een aparte opdracht.
Hoe moet ik mijn data sturen als die gevoelig of groot is?
Voor gevoelige data stuur je een geanonimiseerde of dummy sample die dezelfde structuur en kolomnamen heeft als je echte data. Dit is voldoende voor mij om je code te reviewen en te verbeteren. Ik heb je echte data niet nodig om de code zelf te beoordelen.

