Ik ontwikkel productie rag systemen die zijn ontworpen voor latency, kosten en vertrouwen


Over deze dienst
Automatische vertaling
De meeste RAG-chatbots zijn demo's in productie die goed scoren in screenshots, maar bij de derde gebruikersvraag uit elkaar vallen. Ik bouw de versie die dat niet doet.
Voor teams waarvan de demo (jouw, ChatGPT of die van een freelancer) moet uitgroeien tot iets waar gebruikers op vertrouwen.
𝗥𝗘𝗕𝗘𝗟𝗟𝗘𝗥𝗘𝗡 𝗚𝗘𝗕𝗥𝗨𝗜𝗞𝗚𝗘𝗩𝗘𝗥𝗦 𝗔𝗟𝗟𝗘𝗘𝗡:
Retrieval BM25 + dense + reranker, RAGAS contextprecisie >0.75
Latency onder 800ms tot eerste token, p95 onder 2,5s
Kosten meestal $0.0008/query op gpt-4o-mini, vooraf ingeschat
Vertrouwen op trouw >0.85, bronvermeldingen, observatie per query
𝗣𝗥𝗢𝗢𝗙, 𝗡𝗢𝗧 𝗣𝗥𝗢𝗠𝗜𝗦𝗘𝗦
Elke build wordt geleverd met een eval-rapport tegen JOUW documenten en JOUW Q&A-paren. Als je onder de afgesproken drempels blijft, betaal je de laatste 30%. Schriftelijk.
𝗩𝗔𝗔𝗞𝗣𝗥𝗘𝗜𝗦
Twee productie builds per maand. Als mijn reply badge meer dan 24 uur aangeeft, ben ik die week volgeboekt.
𝗡𝗢𝗧 𝗙𝗢𝗥 𝗝𝗢𝗨 𝗔𝗟𝗟𝗘𝗘𝗡𝗦
Je zoekt ChatGPT wrappers onder $200. Daar zijn er genoeg die je kunt boeken.
𝗡𝗜𝗘𝗨𝗪𝗦𝗧𝗘 𝗦𝗧𝗘𝗣
Stuur een probleemomschrijving van 1 paragraaf, een voorbeeld document en drie voorbeeldgebruikersvragen. Ik reageer binnen 24 uur met een vaste offerte of een doorverwijzing.
Maak kennis met Anwar K
AI Software Engineer
- Afkomstig uitPakistan
- Lid sindsfeb 2026
- Gem. reactietijd1 uur
Talen
Engels
Automatische vertaling

