Icon

MALEK SMIRI PROJET FINAL

TABLE MOVIE movies_directors

(id, director)

TABLE 2 — movies_cast

(id, cast)

TABLE – movies_production_companies

(id, company)

TABLE 4 – movies_genres

(id, genres)

TABLE — movies_core

(id, title, overview, release_date, budget, revenue...)

TABLE – movies_keywords

(id, keyword)

Nettoyage des données

Imporation des données

Nettoyage/ Transformation/Structuration/uniformasiation

Diagramme issues des jointures des tables pour voir les acteurs et company les plus prolifiques

EDA

renomer la colonne
Column Renamer
metrre le nbre de films produits par company en ordre decroissant
Sorter
prendre les 10 plus grande company qui produis le plus de films
Top k Row Filter
filtrer la colnne cast
Column Filter
mettre les acteurs dans l'ordre decroissant
Sorter
renomer la coloone list
Column Renamer
filtrer les acteurs les plus present
Top k Row Filter
table jointe entre movie core et movie cast
Joiner
compter le nbre de films par acteur
Math Formula
Table movie_company(id ,company)
Column Filter
table movie_keywords .csv
CSV Writer
decoupage de la colonne company
Cell Splitter
Tables movies_genres.csv
CSV Writer
filtrer la colonne
Column Filter
bar chart des acteurs les plus present
Bar Chart
renomer la colonne
Column Renamer
Table movie_company.csv
CSV Writer
renomer listcompany en company
Column Renamer
table movie_core
Column Filter
tranformation en plusieurs lignes
Ungroup
enlever la colonne company
Column Filter
Table movies_dierctors.csv
CSV Writer
Table movies_cast.csv
CSV Writer
Decoupage de la colonne keywords
Cell Splitter
tranformation de la colonne en plusieurs lignes
Ungroup
table(movie keywords
Column Filter
Histogram (budget_million)
Histogram
enlever la colonne keywords
Column Filter
renomer la colonne keylist en keywords
Column Renamer
Scatter Plot
crrer des nouvelles colonnes budget et revenue en million de dollars
Math Formula (Multi Column)
importation du fichier
CSV Reader
Traiter les doublons
Duplicate Row Filter
traiter les valeurs manquantes
Missing Value
Filtrer les colonnes pour garder les colonnes les plus utiles
Column Filter
uniformier les données et eliminer les espaces et les caractéres spéciaux
String Manipulation (Multi Column)
Bar Chart des Genres
Bar Chart
Histogram (popularity)
Histogram
Box Plot (Runtime)
Box Plot
table movies core
CSV Writer
GroupBy
histogram (realase year)
Histogram
observation initiale du dataset pour detecter les problems
Statistics View
Column Renamer
decoupage
Cell Splitter
GroupBy
GroupBy
histogram nbre d'acteurs par film
Histogram
Rendre la colonne realase date en type date
String to Date&Time
decoupage
Cell Splitter
Table movies_dierctors
Column Filter
tranformation colonne en lignes
Ungroup
production company qui produit le plus
Bar Chart
tranformation
Ungroup
boxplot keywords
Box Plot
Table movie_cast
Column Filter
Table jointe core et company
Joiner
transformation en plusieurs lignes
Ungroup
enlever la colonne genrs
Column Filter
Table Movie_genres
Column Filter
pour compter le nbre de films par company
Math Formula
decoupage de la colonne genres
Cell Splitter

Nodes

Extensions

Links