Lecture des données
Récuperer les informations sur le photos depuis un fichier flickrRennes.csv
identification des doublons de données et les valeurs cible(colonne) pour la suppresseions des doublons. Gestion des valeurs manquantes par définition des valeurs par défaut et selection des attribut pertinents pour l'analyse et l'atteintes de l'objectif
definition de nombre de classe et application de la méthode k-means pour classifier les points images. Attribution d'une couleur a chaque classe,de point pour la visualisation sur map et sur bar chart
On choisit un cluster et on applique la fouille de donnée texte pour trouver les mots qui decrivent le plus ce point d'interet
Les colonnes tags et title ont été fusionnées pour enrichir la description des lieux, puis les lignes dépourvues des deux champs ont été éliminées.
To use this workflow in KNIME, download it from the below URL and open it in KNIME:
Deploy, schedule, execute, and monitor your KNIME workflows locally, in the cloud or on-premises – with our brand new NodePit Runner.