Ik bouw een real-time data lakehouse pipeline

Sommige informatie is automatisch vertaald.

Sri Lanka

Ik spreek Singalees, Engels

Python developer, FastAPI, Web scraping, AI automation, Data engineering

Ik ben een Data Engineer met meer dan 3 jaar ervaring in de industrie, het bouwen van RESTful APIs, web scraping systemen en AI-gestuurde applicaties. Ik specialiseer me in FastAPI, Streamlit en LangG...
Over deze dienst

Wil je een real-time data pipeline bouwen die je data warehouse altijd up-to-date houdt zonder handmatige ETL jobs?


Ik ontwerp en lever een volledig geautomatiseerde, end-to-end data lakehouse pipeline die elke verandering in je database vastlegt op het moment dat het gebeurt, het door Kafka streamt en het als querybare Delta Lake tabellen landt, allemaal gecoördineerd en gemonitord door Apache Airflow.

Wat je krijgt:


  • Live CDC van je MySQL database (geen downtime, geen handmatige exports)
  • Schaalbare stream processing met Apache Spark
  • S3-compatibele Delta Lake opslag (MinIO) query met Trino of Spark SQL
  • Airflow DAG voor automatische health checks en pipeline monitoring
  • Volledig Dockerized runs op je server of cloud VM
  • Setup gids en documentatie inbegrepen


Perfect voor startups, data teams en bedrijven die betrouwbare, real-time data beschikbaarheid nodig hebben zonder complexe infrastructuur vanaf nul te beheren.

Bestemmingsplatform:

Databricks Lakehouse

PostgreSQL

MySQL

Tools & platforms:

Airbyte

Kafka Connect

Debezium

Apache NiFi

Mijn portfolio