Ik bouw reinforcement learning en reasoning llms voor onderzoek en agents

Sommige informatie is automatisch vertaald.
5,0
5,0

India

Ik spreek Engels, Hindi, Marathi

8 bestellingen voltooid

Ik ben een Computer Vision engineer en data scientist. Geïnteresseerd in werken aan projecten gerelateerd aan machine learning. Ook geïnteresseerd in reinforcement learning en game development. Ik heb...
Over deze dienst

Ben je op zoek naar een AI Research Engineer die gespecialiseerd is in Deep Learning, Reinforcement Learning (RL) en redeneren met Large Language Models (LLMs)?

Ik help onderzoekers, startups en bedrijven bij het ontwerpen, finetunen en optimaliseren van geavanceerde AI-systemen die verder gaan dan eenvoudige tekstgeneratie en redeneren, besluitvorming en gedrag van intelligente agenten mogelijk maken.


Wat ik aanbied:

  • Redeneren LLM ontwikkeling
  • Chain-of-thought prompting
  • Tool-ondersteunde LLMs & multi-step redenering
  • Benchmarking op redeneringsopdrachten
  • Reinforcement Learning voor LLMs
  • RLHF (Reinforcement Learning met menselijke feedback)
  • RLAIF (RL met AI-feedback)
  • Beleidsoptimalisatie voor afstemming & veiligheid
  • Op maat gemaakte Deep Learning oplossingen
  • Transformer-architecturen, embeddings, generatieve AI
  • Finetuning voor domeinspecifieke taken (chatbots, zoekfuncties, samenvattingen, agents)
  • Optimalisatie & implementatie
  • Modelcompressie (quantisatie, pruning, distillatie)
  • Schalbare inference API's & MLOps-pijplijnen

️Tools & frameworks:

  • Deep Learning: PyTorch, TensorFlow, JAX
  • RL & LLM training: Hugging Face TRL, RLHF bibliotheken, PPO, CRPO DeepSpeed, Accelerate
  • Redeneren LLMs: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

Expertise:

Software development

Programmeertaal:

Python

Reviews

1 reviews van deze dienst
5,0

(1)
(0)
(0)
(0)
(0)
Specificering van de beoordeling
  • Communicatieniveau van de freelancer
    5
  • Aanbevelingswaardig
    5
  • Dienst zoals beschreven
    5
Sorteer op
Meest relevant
  • B

    billyjoel99

    US

    Verenigde Staten

    5

    Ok thank you

    Nuttig?
    Ja
    Nee
Reviews

1 reviews van deze dienst
5,0

(1)
(0)
(0)
(0)
(0)
Specificering van de beoordeling
  • Communicatieniveau van de freelancer
    5
  • Aanbevelingswaardig
    5
  • Dienst zoals beschreven
    5
Sorteer op
Meest relevant
  • B

    billyjoel99

    US

    Verenigde Staten

    5

    Ok thank you

    Nuttig?
    Ja
    Nee