Negeer "XXX Items Cleaned" in het overzicht van het pakket, pakketten worden berekend op basis van de datasetgrootte die in de pakketbeschrijving wordt vermeld.
Schoon Dataset:
- Identificeer en corrigeer fouten, inconsistenties of opmaakproblemen binnen de dataset om de nauwkeurigheid te waarborgen en deze klaar te maken voor analyse.
Preprocess Dataset:
- Combineer vergelijkbare categorieën
- Wijzig kolomgegevens types
- Verwijder onnodige kolommen
- Feature engineering op basis van analysemissie
- Normaliseer Dataset
- Standaardiseer Dataset
- Masker/One-Hot Encode
- Outlier detectie
- Voer factoranalyse uit (indien nodig)