Ik bouw een production rag chatbot over je documenten


Over deze dienst
Automatische vertaling
De meeste RAG chatbots falen in productie omdat ze stoppen bij chunk en embed. Dat werkt op 5 documenten. Het breekt bij 500, op multi-page PDFs, en bij complexe vragen.
Ik ben een productie GenAI engineer uit Lahore. Ik heb RAG geïmplementeerd op AWS Bedrock (Llama 3 70B) voor talent matching, en op OpenAI/Pinecone stacks voor klantenservice. Mijn systemen worden geëvalueerd, niet op basis van vibes.
Wat je krijgt:
Intelligent chunking afgestemd op jouw documentstructuur, niet generieke 512-token splitsingen
Hybride zoekfunctie (semantisch + BM25 zoekwoorden) zodat exacte termen nog steeds matchen
Metadata-rijke embeddings + hiërarchische indexen voor lange documenten
RAGAS evaluatierapport Betrouwbaarheid, relevantie van antwoorden, contextprecisie & recall
Bronvermeldingen bij elk antwoord, geen hallucinaties die als feiten worden gepresenteerd
Gedeponeerde demo, broncode, README, 14 dagen ondersteuning na levering
Stacks: AWS Bedrock (Llama 3, Claude), OpenAI, Anthropic, PGVector, Pinecone, ChromaDB, LangChain, LangGraph, FastAPI, Streamlit. Ik adviseer wat het beste past bij jouw budget en datavolume.
Stuur me een bericht met een voorbeelddocument en 5 verwachte vragen, dan vertel ik je eerlijk of het een goede match is.
Maak kennis met Waqar Makki
GenAI Specialist: LLMs, NLP, Computer Vision Expert
- Afkomstig uitPakistan
- Lid sindsjul 2019
- Laatste levering1 jaar
Talen
Urdu, Engels
Automatische vertaling
Veelgestelde vragen
Automatische vertaling
Welke documenttypes ondersteund u?
PDF, DOCX, HTML, Markdown, platte tekst, CSV en websites (via crawl). Gescande PDFs hebben OCR nodig — vraag het vooraf en ik geef een offerte als extra.
Heb ik een OpenAI / AWS account nodig?
Ja — de chatbot draait op jouw account en gebruikt jouw API-sleutels zodat jij de data en de factuur bezit. Ik begeleid je bij de setup.
Hoe zorg je dat het echt correct antwoord geeft?
Ik evalueer elk systeem met behulp van RAGAS — Answer Relevancy, Faithfulness, Context Precision en Context Recall. Je krijgt een rapport met de scores en de vragen waarop het onderpresteert.
Hoeveel kost de LLM API om te gebruiken?
Dat hangt af van het verkeer en de grootte van de documenten. Ik bepaal dat vooraf en adviseer een model dat binnen je budget past.
Kun je het voor mij implementeren?
Ja — Standaard en Premium omvatten deployment naar AWS, Vercel of jouw favoriete platform met een publieke URL of API-endpoint.
