Ik test ai chatbot llm en nlp modellen op nauwkeurigheid, bias, QA en prestaties

Sommige informatie is automatisch vertaald.

Pakistan

Ik spreek Engels

QA-ingenieur

Ik help AI startups en SaaS-bedrijven om productieproblemen, onstabiele releases en AI-fouten te voorkomen, waardoor gebruikersvertrouwen, omzet en investeerdersvertrouwen behouden blijven. Met meer d...
Over deze dienst

80% van de LLMs hallucineert, maar die van jou hoeft dat niet te doen.


Ik ben een QA engineer die gespecialiseerd is in stress-testen van AI chatbots & LLM apps om hallucinations, logische fouten, jailbreak-risico's en veiligheidsproblemen op te sporen. Ik lever binnen 48 uur een forensisch rapport om te zorgen dat jouw gebruikers nooit onvoorspelbare outputs zien.


WAT JE KRIJGT:

Hallucinatietabel (200+ adversarial prompts)

Logische consistentie scoring in belangrijke domeinen

Prompt-injectie/jailbreak pogingen (gebaseerd op OWASP)

Reproduceer stappen, ernst, oplossingen en videobewijs

Optioneel voice walkthrough


WAAROM IK:

Meer dan 6 jaar QA automation, ISTQB gecertificeerd, gepubliceerd over prompt engineering, 400+ Fiverr QA diensten met vijf sterren.


PROCES:

Deel URL/API. Ik maak domeinspecifieke adversarial tests, voer geautomatiseerde + handmatige probes uit en lever een Notion dashboard + PDF + lijst met oplossingen. Optioneel Zoom review.


Pakketten:

BASIS $75 (2 dagen)

  • 50 prompts
  • 5 pagina's foutrapport
  • 1 revisie

STANDAARD $165 (3 dagen)

  • 150 prompts + continuïteit
  • 10 pagina's rapport + heatmap
  • 5 injectietests
  • Video van topfouten
  • 2 revisies

PREMIUM $325 (5 dagen)

  • 300+ multi-turn/code/math/veiligheidstests
  • Volledige OWASP-audit
  • Benchmark versus 2 modellen
  • 30-min consult + 14 dagen ondersteuning
  • Onbeperkte revisies

EXTRAS

  • Zelfde dag +$50
  • API load test (1k) +$75

Testapplicatie:

Website

Ontwikkelingstechnologie:

Django

JavaScript

Python

React

SQL

Apparaat:

PC

Mac

iPhone

iPad

Android telefoon

Mijn portfolio