Ik test ai chatbot llm en nlp modellen op nauwkeurigheid, bias, QA en prestaties
Over deze dienst
80% van de LLMs hallucineert, maar die van jou hoeft dat niet te doen.
Ik ben een QA engineer die gespecialiseerd is in stress-testen van AI chatbots & LLM apps om hallucinations, logische fouten, jailbreak-risico's en veiligheidsproblemen op te sporen. Ik lever binnen 48 uur een forensisch rapport om te zorgen dat jouw gebruikers nooit onvoorspelbare outputs zien.
WAT JE KRIJGT:
Hallucinatietabel (200+ adversarial prompts)
Logische consistentie scoring in belangrijke domeinen
Prompt-injectie/jailbreak pogingen (gebaseerd op OWASP)
Reproduceer stappen, ernst, oplossingen en videobewijs
Optioneel voice walkthrough
WAAROM IK:
Meer dan 6 jaar QA automation, ISTQB gecertificeerd, gepubliceerd over prompt engineering, 400+ Fiverr QA diensten met vijf sterren.
PROCES:
Deel URL/API. Ik maak domeinspecifieke adversarial tests, voer geautomatiseerde + handmatige probes uit en lever een Notion dashboard + PDF + lijst met oplossingen. Optioneel Zoom review.
Pakketten:
BASIS $75 (2 dagen)
- 50 prompts
- 5 pagina's foutrapport
- 1 revisie
STANDAARD $165 (3 dagen)
- 150 prompts + continuïteit
- 10 pagina's rapport + heatmap
- 5 injectietests
- Video van topfouten
- 2 revisies
PREMIUM $325 (5 dagen)
- 300+ multi-turn/code/math/veiligheidstests
- Volledige OWASP-audit
- Benchmark versus 2 modellen
- 30-min consult + 14 dagen ondersteuning
- Onbeperkte revisies
EXTRAS
- Zelfde dag +$50
- API load test (1k) +$75
Testapplicatie:
Website
Ontwikkelingstechnologie:
Django
•
JavaScript
•
Python
•
React
•
SQL
Apparaat:
PC
•
Mac
•
iPhone
•
iPad
•
Android telefoon
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Heb je de source code nodig?
Nee. Alleen black-box testing. Wil je white-box, bestel dan de Premium extra.
Kun je OpenAI GPTs, Claude, Llama, RAG-pipelines testen?
Het maakt niet uit welk model of orkestratielaag.
Wat als er geen bugs worden gevonden?
Je ontvangt nog steeds een volledig auditlogboek dat de robuustheid bewijst—een geweldig marketingmiddel.
Zijn mijn gegevens veilig?
Absoluut. Ik teken NDA's en verwijder alle gesprekslogs na 14 dagen, tenzij je eerder aangeeft dat je dat wilt.
