Icon

KNIME_​project-Camélia

Nettoyage de données

EDA - Analyse de structure

Transformation de la donnée

Import de la donnée

Import du fichier brut et vérification de la structure des données.

Statistiques descriptives pour détecter tendances, valeurs extrêmes et incohérences.

Aperçu global : types de colonnes, NA, distributions.

Répartition des catégories pour les variables qualitatives

Détection visuelle des outliers sur les variables numériques.

Visualisation de la distribution des notes (rating).

Suppression des doublons pour éviter les biais dans l’analyse.

Traitement des NA : suppression des notes manquantes et imputation simple.

Conversion du champ date au bon format pour analyse temporelle.

Élimination des valeurs incohérentes (notes ou âges impossibles).

Création d’une variable dérivée : longueur du commentaire

Classification des commentaires en court/moyen/long.

Classification des ages en adulte/mineur...

Encodage des variables qualitatives en colonnes numériques (0/1).

Agrégations statistiques par groupe (ex. pays, sexe).

Tableau croisé pour analyser la relation entre deux variables.

Suppression automatique des colonnes constantes ou peu informatives.

Export : dataset final 

String Manipulation
Rule Engine
Statistics View
String to Date&Time
Histogram
One to Many
CSV Reader
Box Plot
Low Variance Filter
Statistics
Rule-based Row Filter
Value Counter
Rule Engine
Rule Engine
CSV Writer
Rule Engine
Duplicate Row Filter
GroupBy
Missing Value
Pivot

Nodes

Extensions

Links