Ik ontwikkel schaalbare ETL-pijplijnen met Databricks
Over deze dienst
Heb je een robuuste en schaalbare ETL-pijplijn nodig die op Databricks is gebouwd? Je bent op de juiste plek!
Ik ben Gajendra, een gecertificeerde Data Engineer en Data Analyst met meer dan 6 jaar ervaring in het bouwen van end-to-end data-oplossingen voor grote klanten. Of je nu werkt met batch- of streaming data, ik ben gespecialiseerd in het ontwerpen van schone, efficiënte en productieklare ETL-pijplijnen met behulp van Databricks, PySpark en AWS.
Wat ik aanbied:
- End-to-end ETL/ELT-pijplijnontwikkeling op Databricks
- Data-inname uit meerdere bronnen (S3, RDS, API's, etc.)
- Data schoonmaken, transformeren en verrijken met PySpark
- Integratie met Delta Lake, SQL en cloudopslag
- Workflow orchestratie met Databricks Jobs of Apache Airflow
- Versiebeheer bij deployment (Git, CI/CD)
- Documentatie en notebook-gebaseerde levering
Tools & Technologieën: Databricks (Jobs, Notebooks, Delta Lake), PySpark, SQL, AWS (S3, Glue, Lambda, RDS), Airflow / Databricks Workflows, Git, CI/CD, DBFS
Waarom met mij werken?
- Gecertificeerd in Databricks & AWS
- 6+ jaar ervaring in Data Engineering & Analytics
- Snel en duidelijk communiceren
- Productieklaar code met herbruikbaar ontwerp
Laten we je data workflows automatiseren en opschalen op de juiste manier!
Veelgestelde vragen
Automatische vertaling
Wat heb je van mij nodig om te beginnen?
Gewoon een korte uitleg over je data bronnen, verwachte outputs en cloud setup (indien aanwezig).
Kun je werken met on-prem data of andere cloud providers?
Ja, maar AWS is mijn kernexpertise. We kunnen andere opties bespreken.
