Ik test je llm chatbot op jailbreaks, datalekken en onveilig gedrag

V
vladislav_boev
V
vladislav_boev
Vladislav Boev
Sommige informatie is automatisch vertaald.

Over deze dienst

Automatische vertaling

LLM Gedrags- & Veiligheidstesten door een QA Lead

Ik ben een QA Lead (6+ jaar) die systematisch testontwerp toepast op AI. Ik maak testsets die laten zien waar je LLM-gestuurde bot onveilig gedrag vertoont of zijn eigen regels breekt, jailbreaks, prompt injectie, prompt leaks, hallucinaties, weigeringen, en datalekrisico's.

Hoe het werkt:

  1. Je deelt je system prompt + hoe de bot wordt gebruikt
  2. Ik breng de risicogebieden in kaart die specifiek zijn voor jouw use-case
  3. Ik bouw de testcases (verwacht gedrag + ernst + reden)
  4. Je ontvangt JSONL + CSV + een leesbaar rapport dat klaar is voor je eval harness

Premium: Ik voer de tests ook uit op jouw model en lever een rapport met bevindingen, inclusief input, verwachte versus daadwerkelijke output, en ernst.

Wat ik niet doe: Ik oordeel niet over feitelijke of domeinnauwkeurigheid (juridisch, medisch, etc.), dat vereist een subject-matter expert. Ik test gedrag, veiligheid en instructievolging.

Wil je een grote of doorlopende set? Stuur me een bericht voor een aangepaste offerte. Geschreven in GMT+7. Neem contact op voordat je bestelt.

Maak kennis met Vladislav Boev

Vladislav Boev

Senior QA Lead and Test Architect

  • Afkomstig uitVietnam
  • Lid sindsjun 2026
  • Gem. reactietijd1 uur
  • Talen

    Russisch, Engels
QA Lead with 6+ yrs. Test at architecture level: data flows, integrations, system design, risks. Services: QA Audit: process + test code review. Top risks + roadmap. Test Strategy: levels, tools, effort estimates. Auto-tests: Python + Playwright + Pytest (UI/API). Code Review for test automation. Requirements analysis: find contradictions, gaps, risks. I don't: CI/CD setup (only requirements), performance testing. Written-first. Clear reports. GMT+7 (Asia). Message me before ordering.

Automatische vertaling

Gerelateerde tags