Base clients à nettoyer Gorenja.com

Description : Ce dataset constitue la base clients d'une société de commerce en ligne. Il comporte des informations textuelles et numériques.
Ce dataset comporte plusieurs problèmes ou incohérences. Il est par conséquent intéressant pour étudier le nettoyage de données et le retraitement de valeurs manquantes.
Ci-dessous les problèmes constatés :
- certaines lignes sont dupliquées,
- il y a un certain nombre de valeurs manquantes,
- certaines modalités sont non conformes, donc à réaffecter (variable sexe),
- des caractères ont été saisis par erreur dans des colonnes numériques (nombre de commandes),
- enfin certaines colonnes peuvent être retraitées (somme des colonnes de nombre de commandes avant et après 2021, séparation du nom et du prénom, etc ...).
Format : csv (Séparateur ;) Ligne d'en-tête : Oui Nb observations : 540 Colonnes :
identifiant Login du client
nom Nom complet du client
sexe Sexe du client
adresse Adresse complète du client
daten Date de naissance du client (au format AAAA-MM-JJ)
motpasse Mot de passe crypté du client (SHA1)
derniereip Dernière adresse IP connue du client (IPv4)
mail Adresse mail du client
societe Société pour laquelle travaille le client
anciennete Nombre de mois depuis l'inscription du client
nbc_av2021 Nombre de commandes du client avant l'année 2021
nbc_2021 Nombre de commandes du client sur l'année 2021
totcommandes Total des commandes en euros

Ce dataset est une ressource originale mise à disposition par Gorenja.com
Vous êtes libre de l'exploiter, nous vous demanderons neanmoins, en contre-partie, de bien vouloir citer Gorenja.com dans votre projet ou publication.
Merci pour votre soutien ! Dataset de Gorenja.com