Ik audit en optimaliseer je rag-pipeline voor betere retrieval


Over deze dienst
Automatische vertaling
Je RAG-pipeline haalt verkeerde chunks op en je LLM hallucineert. Het probleem ligt niet bij het model, maar bij de retrieval.
Ik optimaliseer RAG-systemen met meer dan 9 jaar ervaring in search relevance engineering. De meeste RAG-fouten zijn retrieval-fouten, en ik los ze op bij de bron.
Wat ik verbeter:
- Slechte chunking strategieën die context splitsen
- Verkeerde selectie van embedding modellen
- Ontbrekende reranking stage
- Geen hybrid search (keyword + vector gecombineerd)
- Geen retrieval evaluatiemetrics
Wat je krijgt:
- Beoordeling van retrieval kwaliteit met voor/na metrics
- Optimalisatie van chunking strategie voor jouw data
- Evaluatie en aanbeveling van embedding modellen
- Reranking pipeline setup (cross-encoder of ColBERT)
- Implementatie van hybrid search (BM25 + vector + RRF)
- Evaluatiekader (precisie, recall, NDCG, MRR)
Ik werk met elke stack: LangChain, LlamaIndex, custom pipelines. Vector stores: Elasticsearch, OpenSearch, Pinecone, Weaviate, Qdrant, Meilisearch, pgvector.
Dit is geen gig voor het bouwen van chatbots. Ik verbeter de retrieval kwaliteit zodat je LLM niet meer hallucineert.
Stuur me een bericht met je huidige stack, datatypes en de problemen die je ervaart voordat je bestelt.
Maak kennis met Said
Search and AI Architect specializing in Elasticsearch Solr RAG and Vector Search
- Afkomstig uitFrankrijk
- Lid sindsjun 2019
- Gem. reactietijd1 uur
- Laatste levering5 jaar
Talen
Frans, Arabisch, Engels
Automatische vertaling
Mijn portfolio
Veelgestelde vragen
Automatische vertaling
Met welke RAG stack werk je?
Alles. LangChain, LlamaIndex, custom pipelines. Vector stores: Elasticsearch, Pinecone, Weaviate, Qdrant, pgvector. Ik pas me aan jouw stack aan.
Bouw je een RAG-systeem vanaf nul?
Deze gig is voor het auditen en optimaliseren van bestaande pipelines. Voor nieuwe builds, stuur me een bericht om de scope apart te bespreken.
Welke metrics gebruik je?
Retrieval precisie, recall, NDCG, MRR en hit rate. Ik meet voor en na zodat de verbetering wordt gekwantificeerd.
Stem je ook de prompts van de LLM af?
Mijn focus ligt op retrieval kwaliteit. Betere retrieval vermindert hallucineer gedrag zonder prompt tricks. Maar ik kan wel adviseren over promptstructuur.

