Icon

Projet final – Gestion et préparation de la donnée en No-Code V0.1

Nettoyage des données

Import des données

Suppression des doublons et colonne inutiles

Données Manquantes

Format date

Découpage du DATASET

Analyse exploratoire initiale

Analyse post nettoyage

Export CSV

Analyse intermédiaire

Import de tmdb_movies_data.csv
CSV Reader
Suppression de l'ID en doublon
Duplicate Row Filter
Budget
Histogram
Budget (0=manquant)
Rule Engine
Revenus (0=manquant)
Rule Engine
Durée du film (0=valeur la plus fréquente)
Rule Engine
Gestion des valeurs manquantes pour budget, revenus, durée du film, slogan et résumé
Missing Value
Suppression ID Inutil et url site et année de sortie
Column Filter
Durée
Histogram
Box Plot
Scatter Plot
Budget adj (0=manquant)
Rule Engine
Budget adj (0=manquant)
Rule Engine
Durée
Histogram
Statistics View
Row Filter
Reconversion en chiffres budget revenus durée rev adj et bud adj
String to Number
Analyse durée
Histogram
Table budget et revenus
Column Filter
Analyse durée
Box Plot
Analyse descriptive durée
Statistics View
Harmonisation au format M/d/yyyy
String to Date&Time
Budget et revenus
CSV Writer
Histogram
Table films
Column Filter
Split sur le genre
Cell Splitter
Analyse budget
Box Plot
Table Genre à splitter
Column Filter
Indice de corrélation durée et vote
Linear Correlation
Films
CSV Writer
Indice de corrélation budget / Revenu
Linear Correlation
Analyse descriptive du dataset "chiffré"
Statistics View
Genres des films
CSV Writer
Matrice de corrélation
Linear Correlation
Création table genre par ID
Ungroup
Analyse budget revu
Box Plot
Analyse budget et revenu revus
Box Plot

Nodes

Extensions

Links