Ik maak op maat gemaakte dsa training data voor llms python problemen met cot redenering
Over deze dienst
Train je coding LLM op productieklare DSA data, niet gescrapete LeetCode-klonen
Ik bied een premium, originele Python DSA dataset die speciaal is opgebouwd voor LLM training, fine-tuning en evaluatie. Elk probleem is een compleet, zelf-contained trainingvoorbeeld, niet zomaar een vraag en antwoord.
855+ unieke coding problemen, elk inclusief:
ComponentDescriptionPrompt
Gedetailleerde probleemomschrijving met beperkingen, input/output specificaties en validatieregels
Redenering
Stapsgewijze chain-of-thought uitleg over aanpak, algoritmekeuze en randgevallen
Oplossing
Werkende Python-implementatie
Tests
Meerdere testgevallen met assertions om correctheid te verifiëren
Waarom deze dataset anders is
De meeste coding datasets online zijn:
- Gescrapet van openbare bronnen (auteursrecht / duplicatie risico)
- Ontbrekende redeneringstraces (slecht voor CoT / RLHF training)
- Triviaal of repetitief (modellen onthouden, niet generaliseren)
- Niet getest (oplossingen kunnen fout zijn)
De mijne is gebouwd voor AI training vanaf de basis:
- Originele scenario's, real-world gestyleerde problemen (toeleveringsketen, netwerkoptimalisatie, resource allocatie), niet copy-paste LeetCode titels
- Volledige redeneringsketens, ideaal voor training van modellen die denken voordat ze coderen
- Geverifieerde oplossingen + tests
Veelgestelde vragen
Automatische vertaling
Is dit gescrapet van LeetCode of HackerRank?
Nee. Elk probleem is origineel met unieke scenario's, beperkingen en testcases. Veilig voor commercieel LLM training.
In welk formaat ontvang ik het?
Standaard zijn mappen georganiseerd per probleem. Standaard en Premium bevatten JSONL. Vertel me je schema en ik pas het aan.
Kan ik dit gebruiken om een commercieel LLM te trainen?
Premium bevat een licentie voor commercieel gebruik. Basic en Standaard zijn voor evaluatie en onderzoek, tenzij we anders overeenkomen.
Bevat elk probleem chain-of-thought redenering?
Ja. Elk probleem heeft een speciale redeneringsbestand met stapsgewijze uitleg vóór de oplossing.
Zijn de oplossingen geverifieerd?
Ja. Elk probleem bevat een testbestand met meerdere assertions. Oplossingen worden geschreven om alle tests te doorstaan.
Kan ik specifieke onderwerpen aanvragen?
Ja. Standaard en Premium kunnen topic-gefilterde subsets bevatten (bijvoorbeeld alleen grafiekproblemen, alleen DP).
In welke taal zijn de problemen?
Python. Problemen specificeren functiehandtekeningen en I/O. Andere talen op aanvraag via custom order.
Kan ik een voorbeeld zien voordat ik koop?
Stuur me een bericht en ik stuur 2-3 voorbeeldproblemen (gecensureerd) zodat je de kwaliteit kunt beoordelen.
Ondertekent u NDA's?
Ja. NDA en exclusieve licentie zijn beschikbaar als gig extra.
Maak je nieuwe problemen voor mijn use case?
Ja. Op maat gemaakte problemen zijn beschikbaar als add-on of aparte gig.

