Ik automatiseer je data-extractie en CSV-schoonmaak met python
Gegevensingenieur
Over deze dienst
Hoi, ik ben César. Ik ben een engineer met meer dan 3 jaar ervaring in het bouwen van data systemen en het automatiseren van workflows voor overheids- en infrastructuurklanten.
Ik gebruik niet alleen eenvoudige scraper tools; ik schrijf aangepaste Python scripts om rommelige data problemen op te lossen. Als voorbeeld, in een recent project schreef ik een script dat gemapte contactgegevens uit meer dan 1.000 ongestructureerde juridische PDFs haalde in minder dan 4 minuten, een taak die voorheen door een team van meer dan 60 handmatige uren werd gedaan.
Dit is wat ik voor jou kan bouwen:
- Aangepaste Data Extractie: Schone data halen van websites, zelfs als ze inloggegevens, paginering of dynamisch JavaScript gebruiken.
- Data Cleaning & Formatting: Je rommelige CSV's, Excel-bestanden of PDFs aanpassen met Pandas om ze te filteren, dedupliceren en precies te formatteren zoals jij het wilt.
- ETL Pipelines: Ruwe data van elke bron verplaatsen naar schone, gestructureerde outputs (CSV, JSON, SQL).
- Automatiseringsscripts: Ik lever de volledig gedocumenteerde Python broncode zodat jij de extractie zelf kunt uitvoeren wanneer je maar wilt.
Elke script die ik lever is modulair, uitgebreid gecommentarieerd en gebouwd om fouten op te vangen zonder te crashen.
Belangrijk: Stuur me alsjeblieft een korte bericht met je doel-URL of voorbeeldbestand voor je een bestelling plaatst. Ik vind het prettig om de scope vooraf te bepalen.
Technologie:
Excel
•
Google Sheets
•
Python
•
Zapier
Veelgestelde vragen
Automatische vertaling
Met welke bestandsformaten kun je werken?
Ik kan CSV, Excel (.xlsx/.xls), JSON, PDF, Word (.docx), en data van websites of APIs verwerken. Als je een ander formaat hebt, stuur me een bericht — ik laat je weten of ik het aankan.
Krijg ik het Python-script, of alleen de schoongemaakte data?
Het Basic pakket levert alleen de schoongemaakte output. Standaard en Premium pakketten bevatten de gedocumenteerde source code zodat je de automatisering zelf op elk moment opnieuw kunt uitvoeren.
Hoe groot kan mijn dataset zijn?
Basic verwerkt tot 500 rijen. Standaard tot 5.000 rijen. Voor datasets groter dan 5.000 rijen of die database-integratie vereisen, kies je voor Premium of vraag je een offerte op maat.

