Het lijkt erop dat deze dienst tijdelijk niet beschikbaar is
Ik ontwikkel azure ETL-pijplijnen met Databricks
Verenigde Staten
54 bestellingen voltooid
Code bug oplossen en herhalen
Over deze dienst
Ik bied basis ETL-pijplijnontwikkeling met Azure Databricks en Apache Spark. Deze service is geschikt voor kleine tot middelgrote data workloads en voor leer- of prototype-implementaties.
Wat ik doe:
- Build ETL-pijplijnen met PySpark / Spark SQL
- Lees data van Azure Data Lake, Blob Storage of SQL-bronnen
- Voer transformaties uit (filteren, joins, aggregaties, data cleaning)
- Laad verwerkte data in Delta Lake of Azure SQL
- Maak schone en goed gestructureerde Databricks notebooks
- Basis validatie en prestatiebewuste Spark-code
Technische stack:
- Azure Databricks
- Apache Spark (PySpark, Spark SQL)
- Azure Data Lake / Blob Storage
- Delta Lake
Het is het meest geschikt voor basis ETL-workflows, data voorbereiding en Databricks oefenprojecten.
Stuur me een bericht voordat je bestelt om data bronnen en vereisten te bevestigen.
Expertise:
Big data
•
Data-extractie
•
Data validatie
•
etl
Technologie:
Python
•
Databricks
Veelgestelde vragen
Automatische vertaling
Bied je Azure resources aan?
Nee. De koper moet toegang tot Azure Databricks, opslag en benodigde data bronnen zelf regelen.
Welke data bronnen ondersteun je?
Azure Data Lake, Azure Blob Storage, Azure SQL Database en platte bestanden (CSV, Parquet, JSON).
Welke programmeertaal gebruik je?
Voornamelijk PySpark en Spark SQL in Azure Databricks.
Krijg ik de Databricks notebooks?
Ja. Alle notebooks die tijdens het project worden gemaakt, worden gedeeld.
Moet ik contact met u opnemen voordat ik bestel?
Ja. Stuur me eerst een bericht om vereisten, data bronnen en toegang te bevestigen.

