Projet_Final

Filtrer les colonnes id, popularity, original_title, tagline, runtime,overview, realase_date, release_year, vote_count et vote_average pour créer le dataset Movies Info general.

Filtrer les colonnes id, budget, revenue, budget_adj et revenue_adj pour créer le dataset Movies Finances. Ensuite on utilise des Row Splitter pour créer les dataset Movies Finances Clean (Les films avec budget et revenues renseignés) et Movies Finances Missing (les films sans budget ni revenues renseignés)

Filtrer les colonnes id, keywords , cast et genres pour créer le dataset Movies Content. Ensuite on utilise des Cell Splitter pour mettre en format liste les colonnes keywords , cast et genres. Puis on utilise successivement un Ungroup (pour éclater les colonnes en format liste) et un column Renamer pour renommer les cellules éclater. Et enfin on utilise encore des Column Filter pour créer trois dataset Movies Acteurs (id , cast) , Movies Mots clés (id, keywords) et Movies Genres (id , genres). Ces trois dataset vont passer par des Duplication Row Filter et des Missing Values d'être des dataset Cleans et exploitables.

Filtrer les colonnes id, director et production_companies pour créer le dataset Movies Production. Ensuite on utilise un Cell Splitter pour mettre en format liste la colonne production_companies. Puis on utilise successivement un Ungroup (pour éclater la colonne en format liste) et un column Renamer pour renommer en production_companies. On utilise encore des Column Filter pour créer les datasets Movies Director (id , director) et Movies Production companies (id, production_companies). Ces datasets seront dédupliquer avant que qu'on utilise un Groupby sur le dataset Movies Production Companies pour créer un dataset regroupant le nombre de film par maisons de production.

On va utiliser un Joiner pour associer les dataset Movies Finance Clean et Movies Acteurs Clean et créer ainsi le dataset Movies Cast et Finance pour voir l'impact des acteurs sur les finances d'un film. On applique également un Groupby à notre dataset Movies Cast et Finance ainsi on peut voir le nombre de film, les revenues en moyenne et le budget en moyenne des films par acteurs.

Projet_​Final

Nodes

Extensions

Links

Download