Ik maak je datasets schoon, deduplicateer ze en bereid ze voor op professionele analyse

Sommige informatie is automatisch vertaald.

Brazilië

Ik spreek Portugees, Engels

Data analist

Data engineering student gericht op SQL, ETL-pijplijnen en relationele databases. Ik bouw oplossingen vanaf nul — ER-modellering, SQL Server met Docker, Python-pijplijnen en Star Schema data warehouse...
Over deze dienst

Heb je rommelige spreadsheets, dubbele rijen of meerdere bestanden die samengevoegd moeten worden? Ik maak je CSV- of Excel-bestanden schoon met Python en lever een kant-en-klaar dataset op.


Wat ik fix:

- Dubbele rijen verwijderd

- Kolomnamen gestandaardiseerd (snake_case)

- Gegevens types automatisch gedetecteerd (nummers, data)

- Encodering problemen opgelost (accenten, speciale tekens)

- Lege rijen en kolommen verwijderd

- Meerdere bestanden samengevoegd tot één schoon dataset


Wat je me stuurt: je CSV- of Excel-bestand(en)

Wat je terugkrijgt: een schoon bestand + een overzicht van elke wijziging



Vervuilde spreadsheets, dubbele rijen of meerdere bestanden samenvoegen? Ik maak je data schoon met Python en lever een klaar-voor-gebruik dataset op.


Wat ik corrigeer:

- Duplicaten verwijderd

- Kolomnamen gestandaardiseerd

- Types automatisch gedetecteerd

- Encodering aangepast (accenten, speciale tekens)

- Lege rijen en kolommen verwijderd

- Verschillende bestanden samenvoegen in één

Mijn portfolio