Ik maak hoogwaardige training datasets van je documenten voor llm fine tuning

Sommige informatie is automatisch vertaald.

Bulgarije

Ik spreek Engels, Bulgaars

AI Training Data Specialist Documenten tot Fine Tuning Datasets

Oprichter van UMELLE, een maatwerk softwarebedrijf dat diensten levert aan de verzekerings- en financiële sector. Ik bouw AI-gestuurde document intelligentiesystemen en maak training datasets van zake...
Over deze dienst

Stuur me een bericht voordat je bestelt, zodat ik kan bevestigen dat je documenten passen bij het gekozen pakket.


Ik maak multi-angle training datasets van jouw bedrijfsdocumenten die LLMs leren om daadwerkelijk te redeneren over jouw domein.


HOE HET WERKT:

Stuur me je PDFs, Word-documenten of beleidshandleidingen. Ik genereer paren per documentdeel over drie redeneerhoeken:


Feitelijk: "Welke soorten waterschade worden uitgesloten onder Sectie 4?"

Voorwaardelijk: "Wordt een laptop die gestolen wordt tijdens gebruik voor freelance werk gedekt?"

Uitsluiting: "Wat wordt NIET gedekt wanneer de jaarlijkse omzet meer dan $50.000 bedraagt?"


Elk paar wordt gecontroleerd aan de hand van de brontekst, daarna review ik op nauwkeurigheid voordat ik het lever.


WAT JE KRIJGT:

- Alpaca-formaat JSONL-bestand dat klaar is voor elk fine-tuning pipeline (Unsloth, LLaMA Factory, OpenAI, etc.)

- Multi-angle paren (feitelijk, voorwaardelijk en uitsluitingsredenering)

- Cross-document synthese paren die kennis verbinden over gerelateerde bestanden

- 2-3x meer paren per chunk dan concurrenten met enkel vragen


IDEAL VOOR:

Verzekering, juridisch, compliance, productdocumentatie, bedrijfsvoering


Ontvang het volledige model: https://www.Fiverr.com/s/Ld5qPg4

Programmeertaal:

Python

AI model frameworks en tools:

Hugging Face Transformers

PyTorch

Datatype:

Tekst

AI engine:

GPT

DeepSeek

Llama

Langchain

PyTorch