Ik createer en automatiseer ETL data pipelines met Python
Over deze dienst
Heb je data verspreid over systemen die nooit met elkaar praten? Worden je rapporten nog steeds handmatig elke week gemaakt?
Ik ontwerp en automatiseer ETL data pipelines met Python zodat je data precies daar komt waar het moet zijn, volgens schema, zonder handmatig werk.
Ik heb productiepipelines gebouwd bij Carrefour (PySpark + Airflow op GCP) en Cognizant (BI-pipelines voor wereldwijde klanten). Ik weet wat er fout gaat in echte data en hoe je dat kunt voorkomen.
Wat ik bouw
- ETL pipelines: extractie uit APIs, databases, Excel, CSV's
- Data transformatie en schoonmaak met Python & Pandas
- Load naar BigQuery, MySQL, Google Sheets
- Geplande automatisering met Airflow
- Automatische rapporten die volgens schema worden geleverd, zonder handmatig werk
Tech stack
Python · SQL · Pandas · PySpark · Apache Airflow · BigQuery
Google Cloud (GCP) · PostgreSQL · REST APIs · Excel / Google Sheets
Voor wie dit is
Financiële of operationele teams die verdrinken in handmatige rapportages
Startups die een data pipeline nodig hebben, maar geen fulltime engineer
Bedrijven die overstappen van Excel naar een goede data stack
Stuur me een bericht voordat je bestelt, ik vertel je eerlijk of jouw use case past.
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Welke informatie heb je nodig om aan de slag te gaan?
Ik moet begrijpen waar je data vandaan komt (waar de data zich bevindt), hoe de output eruit moet zien en hoe vaak het moet draaien. Een korte uitleg van je huidige handmatige proces is erg handig — hoe meer context je deelt, hoe sneller ik iets kan bouwen dat echt past.
Blijft de pipeline draaien na levering, of heb ik een developer nodig om het te onderhouden?
De pipelines die ik lever zijn ontworpen om volgens schema te draaien zonder handmatige tussenkomst. Ik voeg documentatie en een walkthrough toe zodat je team het kan onderhouden en bijwerken. Voor oplossingen die in de cloud draaien, zet ik monitoring en alerts op zodat je meteen weet als er iets misgaat.
Met welke data bronnen kan ik verbinden?
Excel, CSV, Google Sheets, REST APIs, SQL databases (PostgreSQL, MySQL, BigQuery, SQL Server), SAP exports en de meeste cloud storage systemen (GCP, AWS S3). Als je een specifieke bron hebt, stuur me een bericht en ik bevestig dat voordat je bestelt.
Werk je met vertrouwelijke bedrijfsgegevens?
Ja. Ik werk regelmatig met gevoelige financiële en operationele data in mijn bedrijfswerk. Ik ben comfortabel met het ondertekenen van NDA's en kan tijdens de ontwikkeling werken met geanonimiseerde voorbeeldgegevens indien nodig.

