Ik auditeer en optimaliseer je rag vector search prestaties


Over deze dienst
Automatische vertaling
Je RAG draait in productie maar geeft slechte resultaten. De latency is traag. De kosten lopen op. Hallucinaties sluipen door. Klinkt bekend?
Ik audit en repareer RAG-pijplijnen die er op papier goed uitzien maar in de praktijk falen. Meer dan 10 jaar ervaring met backend werk in productie, momenteel leid ik de AI search migratie voor een van de grootste retailers van Latijns-Amerika (50K+ producten, 1M+ dagelijkse gebruikers).
Wat ik audit:
- Embedding model geschikt voor jouw domein
- - Chunking strategie en overlap
- - Retrieval recall en precisie (met eval set)
- - Reranking effectiviteit
- - Hybride search gewichten (keyword vs semantisch)
- - Latency per fase en kosten per query
- - Hallucinatiepatronen
Wat je krijgt:
- Geschreven diagnose met prioriteit voor fixes
- - Codewijzigingen voor de belangrijkste issues (Standard / Premium)
- - Eval set zodat je de voortgang kunt meten
- - Monitoring setup (Premium)
Stack: Python, OpenAI, Anthropic, Pinecone, Weaviate, Qdrant, pgvector, LangChain.
Stuur me je stack en één voorbeeld query die faalt. Ik vertel je wat waarschijnlijk kapot is voordat je betaalt.
Maak kennis met Martin Poli
Senior RAG and AI Search Engineer for Backend at Scale
- Afkomstig uitUruguay
- Lid sindsmrt 2020
Talen
Engels
Automatische vertaling
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Heb je toegang nodig tot mijn codebase?
Voor alleen audit (Basic) niet, ik werk op basis van jouw beschrijving en voorbeeld queries. Voor implementatie (Standard/Premium) ja, lees toegang tot repo en een testomgeving.

