Ik maak je data schoon en preprocess voor analyse of ml

Sommige informatie is automatisch vertaald.

India

Ik spreek Hindi, Nepalees, Engels, Urdu, Duits, Frans

Machine Learning en Data Science voor toepassingen in de echte wereld

Ik ben een afgestudeerde in Computer Science, gespecialiseerd in AI & Data Science, met praktische ervaring in onderzoek en de industrie. Ik werk aan projecten met machine learning, deep learning, NLP...
Over deze dienst

WAT IK GA REPAREREN

  • Ontbrekende waarden (verwijderen, invullen, interpoleren of markeren, afhankelijk van wat logisch is voor jouw data)
  • Dubbele rijen en kolommen (herkend en verwijderd met logica)
  • Verkeerde datatypes (strings naar nummers, datuminvoer, categorische codering)
  • Inconsistente opmaak (hoofdletters, spaties, speciale tekens, eenheden)
  • Detectie en afhandeling van outliers (IQR, Z-score markering of verwijderen)
  • Kolomnamen hernoemen en structureren (nettere headers, consistente naamgeving)
  • Kenmerkenschaal en normalisatie (MinMax, StandardScaler indien nodig)
  • Categorische variabelen coderen (Label encoding, One-Hot encoding)


<strong WAT JE ZULT ONTVANGEN

  • Opgeruimde dataset (CSV of Excel)
  • Python script (.py of .ipynb)
  • Korte rapport over wat is veranderd en waarom, geen verrassingen
  • Basis samenvatting voor/na (aantal rijen, ontbrekende waarden, datatypes)


WAT JE MOET STUREN

1. Je dataset (CSV, Excel, JSON)

2. Waar je het voor wilt gebruiken (analyse, ML, dashboard etc.)

3. Eventuele specifieke kolommen of problemen om op te focussen (optioneel)


Dat is alles. Ik regel de rest.


WAAROM KIEZEN VOOR MIJ

  • Eigen ervaring met het opschonen van onderzoeksdata, geen tutorials
  • Reproduceerbare code die je opnieuw kunt gebruiken
  • Duidelijke documentatie van elke wijziging
  • Snelle levering

Mijn portfolio