Ik doe web scraping, data scraping, PDF-extractie en data-automatisering in python

Sommige informatie is automatisch vertaald.

Pakistan

Ik spreek Engels

Ingenieur machine learning

Ik ben een machine learning engineer met ervaring in LLM-gebaseerde oplossingen, finetuning van vision-language modellen en multimodale KVP-detectie. Ik heb ervaring met Python, PyTorch, TensorFlow en...
Over deze dienst

Moet data worden geëxtraheerd, geautomatiseerd of geleverd in een schoon bruikbaar formaat? Je bent op de juiste plek.


Ik ben gespecialiseerd in Python-gebaseerde web scraping, data-extractie, PDF-mining en geautomatiseerde data pipelines. Static of dynamisch, inloggen vereist of CAPTCHA-beschermd, ik regel het allemaal en lever schone, gestructureerde, kant-en-klare resultaten.


Wat ik aanbied:

  • Static en dynamic website scraping
  • Inloggen vereiste en JavaScript-gerenderde pagina's
  • CAPTCHA omzeilen en anti-scraping handling
  • PDF-tekst extractie en OCR voor gescande documenten
  • E-commerce, directory en bedrijfsdata scraping
  • Geplande en geautomatiseerde scraping pipelines
  • Data schoonmaken, transformeren en structureren


Tools: Python, Scrapy, BeautifulSoup, Selenium, Playwright, Pandas, pdfplumber, Tesseract OCR

Output: CSV, Excel, JSON, Google Sheets, PostgreSQL, MongoDB

Waarom ik? Ik lever niet alleen ruwe data, ik maak het schoon, structureer het en lever het in het formaat dat jouw workflow nodig heeft. Snelle levering, schone code, onbeperkte revisies.

Stuur me een bericht voordat je een bestelling plaatst om je doelwebsite te bespreken en vertragingen te voorkomen.


Laten we je data voor je laten werken.

Technologie:

C#

Python

Google Sheets

Excel

Scrapy

Type informatie:

Contactinformatie

Afbeeldingen

Techniek:

Geautomatiseerd