Ik bouw een python ETL-script om je CSV-gegevens schoon te maken, samen te voegen en te consolideren

Sommige informatie is automatisch vertaald.

India

Ik spreek Engels, Japans, Frans

1 bestelling voltooid

Data en Software

Ik ben een Python data engineer die gespecialiseerd is in ETL-pijplijnen, data cleaning en CSV/Excel consolidatie. Ik zet rommelige, inconsistente exports uit meerdere bronnen om in één schone, gevali...
Over deze dienst

Heb je spreadsheets van verschillende teams, tools of afdelingen, elk met andere kolomnamen, datumnotaties, dubbele records en onzuivere waarden? Handmatig schoonmaken en samenvoegen is traag en foutgevoelig. Ik automatiseer het hele proces in Python + Pandas.

Wat ik doe

Ik bouw een herbruikbare ETL-workflow die:

  • Haalt data uit al je CSV/Excel-bestanden in één keer
  • Maakt verschillende bronkolomnamen gelijk aan één standaard schema
  • Schoont & standaardiseert whitespace, titelcase, converteert alle datums naar YYYY-MM-DD, verwijdert $/eenheden en zet bedragen & hoeveelheden om in schone getallen
  • Standaardiseert categorieën (bijvoorbeeld statuswaarden in één consistente set)
  • Valideert records en verwijdert rijen zonder verplichte velden
  • Verwijdert duplicaten zodat elk record maar één keer voorkomt
  • Consolideert alles in één enkele, UTF-8, rapportageklare masterfile

Wat je krijgt

  • Een schoon, goed gedocumenteerd Python-script dat jij volledig bezit
  • Je geconsolideerde outputbestand (CSV/Excel)
  • Een README met installatie- en gebruiksinstructies
  • Code die herbruikbaar is voor de bestanden van volgende maand zonder opnieuw te hoeven werken

Waarom ik

  • Specialist in data engineering & ETL, geen generalist
  • Schone, leesbare, commentaar gevulde code (geen zwarte dozen)
  • Consistente, herhaalbare resultaten bij elke run
  • Snelle reacties, op-ti

Technologie:

Amazon Redshift

apache vonk

Excel

MATLAB

Python

Expertise:

Classificatie

Data-extractie

Datastroom

Mijn portfolio