Ik bouw en optimaliseer schaalbare databricks delta lake pipelines
Data engineering, Azure, AWS, Databricks, Lakehouse, Spark, Fabric
Over deze dienst
Microsoft & Databricks gecertificeerde senior data engineer (meer dan 9 jaar ervaring)
Houd je niet langer bezig met rommelige data. Bouw een enterprise-grade Lakehouse die meegroeit. Als een dual-gecertificeerde expert ontwerp en optimaliseer ik productieklare data platforms op AWS, Azure en Databricks.
Wat ik lever:
- Medallion Architectuur: Volledige implementatie van Bronze, Silver en Gold lagen voor data-integriteit.
- Schalende pipelines: Hoogwaardige Batch & Streaming ETL/ELT met PySpark en Spark SQL.
- Databricks ecosysteem: Beheersing van Unity Catalog (Governance), Delta Live Tables (DLT) en Asset Bundles (DABs).
- Cloud integratie: Expertinstelling voor AWS (S3, Glue, EMR, Athena) en Azure (Fabric, ADF, Synapse, OneLake).
- Kostenoptimalisatie: Geavanceerde tuning (Z-Order, Liquid Clustering) om je cloud compute-kosten te verlagen.
- AI-Ready data: Gespecialiseerde data voorbereiding voor GenAI, RAG chatbots en Mosaic AI.
Waarom met mij werken?
- Meer dan 9 jaar ervaring: Diepgaande ervaring met enterprise-scale, complexe data-omgevingen.
- Productieklare code: Schone, goed gedocumenteerde en zeer onderhoudbare code.
- Prestaties gericht: Systemen geoptimaliseerd voor sub-seconde queries en maximale efficiëntie.
- Transformeer je ruwe data in een strategisch bezit. Neem vandaag nog contact met mij op
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Welke soorten projecten behandel je?
Ik verzorg ETL pipelines, data lake/lakehouse architectuur, cloud migratie, data optimalisatie en analytics pipelines.
Met welke cloudplatforms werk je?
AWS, Azure en Databricks.
Werk je met zowel batch- als streaming data?
Ja, ik werk met batch, near-real-time en streaming data pipelines.
Welke hulpmiddelen en technologieën gebruikt u?
PySpark, Spark SQL, Azure Data Factory, AWS Glue, Databricks, EMR, Synapse en meer.
Kun je bestaande pipelines optimaliseren?
Ja, ik ben gespecialiseerd in prestatie tuning en kostenoptimalisatie.
Lever je documentatie aan?
Ja, duidelijke technische documentatie is inbegrepen.
Kun je meerdere databronnen integreren?
Absoluut — APIs, databases, cloud opslag en flat files.
Ondersteun je lange termijn projecten?
Ja, ik sta open voor lange termijn en doorlopende support opdrachten.
Zal mijn data veilig zijn?
Ja. Ik volg de beste praktijken in de industrie voor data beveiliging en toegangscontrole.
Werk je met grote datasets?
Ja, ik verwerk regelmatig miljoenen tot miljarden records.

