Ik bouw een productieklare graphrag chatbot voor je documenten


Over deze dienst
Automatische vertaling
Je bent klaar met demo's die instorten zodra je echte documenten aansluit. Ik ben een AI/ML engineer die Retrieval-Augmented Generation (RAG) systemen bouwt die je echt kunt gebruiken: ingestion, embeddings, retrieval, grounding, Fast-API endpoints, en een duidelijk pad om te deployen op GCP als je dat wilt.
WAT IK VAN JOU NODIG HEB VOORDAT WE BEGINNEN
- voorbeeld documenten of toegang
- toon van spreken
- talen
- hosting beperkingen
- privacyregels
- Een scope: [basic/standard/premium bullets match packages]
- Code die je kunt inspecteren (schoon structuur, geen black box).
- Een korte overdracht: hoe nieuwe bestanden te importeren, chunk size/top-k afstemmen, modellen wisselen.
WAT DIT NIET IS
- Juridische/medische zekerheid of beloftes dat het nooit hallucineert.
- Training van scratch mega-modellen op een klein budget - ik stel fine-tuning of kleinere modellen voor waar het binnen je scope past.
Als je je use case + documenttypes plakt, reageer ik met wat haalbaar is in elk pakket en realistische tijdlijnen - geen verkooppraatje.
-Haris
Maak kennis met Haris Waqar
Ai ML Engineer
- Afkomstig uitPakistan
- Lid sindsokt 2025
- Gem. reactietijd1 uur
Talen
Urdu, Engels
Automatische vertaling
Veelgestelde vragen
Automatische vertaling
Bouw je met LangChain/LlamaIndex of raw APIs? Welke geef je de voorkeur?
Ik geef de voorkeur aan Fast-API integratie met LangChain.
Kun je Gemini / OpenAI gebruiken—wie betaalt tokens?
Ja, ik gebruik Gemini, omdat open ai modellen niet goed genoeg zijn.
Mijn documenten zijn meertalig—beïnvloedt dat chunking of embeddings?
Nee, dat beïnvloedt de chunking van de documenten niet.
Kunnen we alles hosten op GCP en data in ons account houden?
Ja, we kunnen alles hosten op GCP met containerisatie en docker, afhankelijk van het pakket dat je kiest.
Wat gebeurt er als retrieval verkeerde snippets teruggeeft—hoe verbeteren we dat?
We lossen dat op met praktische stappen: log fouten → controleer of waarheid in top-k staat → afstemmen chunking + hybrid + filters → reranker toevoegen → query herschrijven afstemmen → corpus opschonen. Die volgorde vermijdt willekeurige tuning en lost meestal de meeste gevallen op per uur dat je besteedt.
Bied je tweaks na levering of een onderhoudsperiode aan?
Ja, afhankelijk van het gekozen pakket

