Ik bouw grote data pipelines en verwerk datasets met behulp van pyspark en sql

Sommige informatie is automatisch vertaald.

Pakistan

Ik spreek Engels, Frans

AI-, Data- en Web3-engineer

Ik ben een ML & Data Engineer met een Master in Data & Intelligence van Université Claude Bernard Lyon 1. Ik specialiseer me in het overbruggen van de kloof tussen geavanceerd AI-onderzoek en schaalba...
Over deze dienst

Worstelt je met enorme datasets of trage verwerkingstijden?


Ik ben een Data Engineer die gespecialiseerd is in grootschalige Big Data verwerking, ETL en analytics. Ik bouw zeer geoptimaliseerde data pipelines om gigabytes aan data efficiënt te importeren, schoon te maken en te transformeren met behulp van PySpark en Python. Of je nu complexe aggregaties, geospatiale mapping of schone visualisaties nodig hebt, ik lever productieklare code.


Mijn kernservices:


  • Big Data pipelines: High-performance ETL-workflows met Apache Spark, PySpark en Python.
  • Geavanceerde transformaties: Geoptimaliseerde Spark SQL-query's, complexe window functies, UDFs en grootschalige joins.
  • Data-integratie: Structuur- en semi-gestructureerde data schoonmaken en formatteren voor verdere analytics.
  • Geospatiale data: Verwerking van locatie- en tijdreeksgegevens.
  • Visuele inzichten: Big data vertalen naar bruikbare visualisaties met Pandas en Matplotlib.


Tech stack: Python | Apache Spark | PySpark | Spark SQL | Pandas | Matplotlib


Waarom ik?

Ik schrijf schone, schaalbare en volledig gedocumenteerde code, zodat je data-operaties nauwkeurig en computationeel geoptimaliseerd zijn.


Stuur me gerust een bericht voordat je bestelt om je dataset te bespreken!

Bestemmingsplatform:

Databricks Lakehouse

PostgreSQL

Apache Hive

Tools & platforms:

Overige