Ik finetune llms en bouw rag-pijplijnen voor je ai-app


Over deze dienst
Automatische vertaling
Ben je een AI-toepassing aan het bouwen die een aangepast taalmodel of een kennis-gestuurde chatbot nodig heeft? Je bent op de juiste plek. Ik ben Yash, een ML Engineer met meer dan 6 jaar ervaring en praktische ervaring met productie-LLM's bij Fidelity National Financial, waar ik LayoutLMv3 (een multimodaal transformer/LLM) heb gefinetuned voor document intelligence op echte bedrijfsgegevens.
Wat ik voor je maak:
- Open-source LLMs finetunen (LLaMA 3, Mistral, Falcon, BERT, LayoutLM) op jouw eigen dataset met LoRA / QLoRA / volledige finetuning
- RAG-pijplijnen verbinden je LLM met je knowledge base via vector databases (Pinecone, ChromaDB, FAISS, Weaviate)
- Aangepaste chatbots die vragen beantwoorden uit je documenten, PDFs, databases of APIs
- Evaluatie & benchmarking van LLM's om nauwkeurigheid, hallucinatiepercentage en latency te meten
- Prompt engineering & systeem prompt optimalisatie voor consistente, betrouwbare outputs
Waarom mij inhuren?
- Ervaring met het finetunen van enterprise LLMs in productie (geen tutorials)
- IIT Kharagpur Dual Degree (B.Tech + M.Tech)
- Schoon, gedocumenteerd, productie-klaar code in Python
- Ervaring met Azure deployment voor schaalbare inference
Maak kennis met Yash Bhardwaj
I build GenAI apps, LLM pipelines and NLP systems that ship to production
- Afkomstig uitIndia
- Lid sindsapr 2026
- Gem. reactietijd1 uur
Talen
Hindi, Engels
Automatische vertaling
Veelgestelde vragen
Automatische vertaling
Heb je mijn data nodig om gelabeld te worden?
Voor finetunen ja — ik kan je ook helpen je dataset te structureren en te annoteren als extra service. Voor RAG werken ruwe documenten (PDF, TXT, DOCX) perfect.
Met welke LLMs werk je?
Open-source modellen — LLaMA 3, Mistral, Phi-3, BERT en de LayoutLM-familie — finetuned met LoRA/QLoRA via HuggingFace. Ik ondersteun ook OpenAI's fine-tuning API voor GPT-gebaseerde modellen.
Kun je het model ook deployen?
Ja — ik deploy naar elke cloudplatform: AWS SageMaker, Google Cloud Vertex AI, Azure ML of Hugging Face Spaces. Ik bouw ook inference endpoints met FastAPI in Docker, die overal kunnen worden ingezet. Voor mobiele/edge gebruiksgevallen worden TensorFlow Lite en ONNX export ondersteund. Deployment bevat een werkende API.

