Icon

projet_​FSY

Lecture des données

Récuperer les informations sur le photos depuis un fichier flickrRennes.csv

Préparation des données et sélections des attributs utiles

identification des doublons de données et les valeurs cible(colonne) pour la suppresseions des doublons. Gestion des valeurs manquantes par définition des valeurs par défaut et selection des attribut pertinents pour l'analyse et l'atteintes de l'objectif

Classification des points par la méthode de clutster

definition de nombre de classe et application de la méthode k-means pour classifier les points images. Attribution d'une couleur a chaque classe,de point pour la visualisation sur map et sur bar chart

Processus de fouille et traitement des données textuelles
Identification des mots descriptif d'un cluster (point d'intéret)
Choix du cluster pour la fouille ensembliste

On choisit un cluster et on applique la fouille de donnée texte pour trouver les mots qui decrivent le plus ce point d'interet

Préparation des données pour la fouille ensembliste et textuelle

Les colonnes tags et title ont été fusionnées pour enrichir la description des lieux, puis les lignes dépourvues des deux champs ont été éliminées.

lecture des lignesInformations sur des photos
CSV Reader
Strings to Document
identifier le nombre de ligne identique sur le regrouprement d'un/plusieurs attributs
GroupBy
Faire ressortir les lignes doublons suivant l'attribut cible du doublon de données
Row Filter
Retirer tous les signes de ponctuactions
Punctuation Erasure
Retirer les mots qui n'ont pas sens
Stop Word Filter
Convertir tout en minuscule
Case Converter
remplacer les mots par leur racine
Snowball Stemmer
Retirer tous les mots numériques
Number Filter
obtenir les itemsets fréquents pour le cluster choisir (point d'intéret)
Item Set Finder (Borgelt)
Retirer les mots trop courts
N Chars Filter
entrepot des mots
Bag Of Words Creator
proportionalisation des lignes de données
Document Vector
collection de vecteur binaire
Create Bit Vector
visualisation des coordonnée sur un map
OSM Map View
Category to Class
liste de mots différents trouvés
Unique Term Extractor
Suppression des lignedoublons par rapport à l'attribut cible
Duplicate Row Filter
retirer les lignes avec description vide
Row Filter
remplacer les valeurspar des valeurs par défaut
Missing Value
combiner tag et title en une colonne description
Column Combiner
Sélection des attributs utiles
Column Filter
Column Filter
k = 10 répartition en 10 cluster des nuage de points.
k-Means
Filtrer sur les cluster
Row Filter
obtenir le nombre de point par cluster
GroupBy
visualisation des stats par cluster
Bar Chart
Définition d'un code couleur par chaque classe
Color Manager
visualiser les points colorié par classe d'appartenance
OSM Map View

Nodes

Extensions

Links