Ik voer data cleaning en preprocessing uit in python voor machine learning
Complexe problemen omzetten in slimme oplossingen met Artificial Intelligence
Over deze dienst
Stuur me een bericht voordat je bestelt, zodat ik je data kan bekijken en eerlijk kan inschatten wat er nodig is.
Rommelige data verpest modellen en kost uren. Ik ben Yasir Ahmad Malik, een AI-engineer (MSc in Kunstmatige Intelligentie). Ik zet ruwe, rommelige datasets om in schone, ML-klaar data.
Wat ik aanbied:
- Data cleaning ontbrekende waarden
- Duplicaten
- Outliers
- Inconsistente formaten, feature engineering & selectie, encoding (one-hot, label), scaling/normalisatie, tekstvoorbewerking voor NLP (tokenisatie, stopwoorden, lemmatization), beeldvoorbewerking (resizing, augmentatie, filtering)
- Tijdreeksvoorbereiding (lag features, rolling stats, stationariteitscontroles)
- Herbruikbare preprocessing pipelines (Scikit-learn klaar)
- Voor- en na-rapport over data kwaliteit met visualisaties
Tools:
- Python
- Pandas
- NumPy
- Scikit-learn
- OpenCV
- NLTK
Wat je krijgt:
- Schoon dataset in jouw gewenste formaat (CSV/Excel/etc.)
- Gedocumenteerde, herbruikbare code zodat je het op toekomstige data zelf kunt uitvoeren.
- Een samenvatting van elke transformatie die is toegepast en waarom
- Snelle, communicatieve levering
- Geef je modellen schone data en bereik betere resultaten.
Stuur me een voorbeeld van je data, en ik vertel je precies wat het nodig heeft.
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Zijn mijn gegevens vertrouwelijk?
Jouw data wordt alleen gebruikt voor jouw project en wordt verwijderd na levering. Ik werk graag onder een NDA als dat nodig is.
Kun je ook het ML-model bouwen na het schoonmaken?
Absoluut — bekijk mijn machine learning dienst, of stuur me een bericht en ik bundel beide in één op maat gemaakte aanbieding.
Welke formaten accepteert u?
CSV, Excel, JSON, SQL exports, tekstbestanden en afbeeldingen. Iets anders? Vraag het gerust.

