Ik bouw een geautomatiseerde ETL data pipeline met Python en Airflow
Data Engineer en Geavanceerde Web Scraping Specialist
Over deze dienst
Neem geen zakelijke beslissingen meer op basis van rommelige, onbetrouwbare data.
Ik ben een Data Engineer die gespecialiseerd is in de Modern Data Stack. Ik bouw robuuste, idempotente en volledig geautomatiseerde data pipelines die ruwe, ongestructureerde inputs omzetten in schone, analytics-waardige data.
Of je nu een eenvoudig script nodig hebt om API-data te verplaatsen of een volledige "Medallion Architecture" data lake, ik ontwerp systemen die meegroeien.
Mijn expertise & tech stack:
- Orkestratie: Apache Airflow
- Real-time streaming: Apache Kafka
- Transformaties & kwaliteit: dbt Core (geautomatiseerd testen & datamodellering)
- Opslag: PostgreSQL, AWS S3, MinIO
- Infrastructuur: Docker Compose, Terraform (AWS EC2, RDS)
- Visualisatie: Metabase integraties
Wat je kunt verwachten:
- Betrouwbaarheid: Pipelines die falen soepel afhandelen met automatische retries.
- Data kwaliteit: Ingebouwde dbt tests (null checks, uniciteit) zodat je alleen nauwkeurige data opvraagt.
- Schone levering: Volledig gecontaineriseerde code (Docker) met uitgebreide documentatie (README.md) voor eenvoudige deployment op je eigen servers.
Stuur me alsjeblieft een bericht voordat je een bestelling plaatst, zodat we je specifieke data bronnen en zakelijke vereisten kunnen bespreken!
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Plaats je de pipeline in mijn cloud omgeving?
Ja! Voor het Premium pakket lever ik Terraform scripts (Infrastructure as Code) om automatisch de benodigde AWS resources (EC2, RDS, S3) te provisionen en de Dockerized pipeline te deployen.

