Icon

HotelBooking_​DM_​v6

Contexto: Este conjunto de datos contiene 119390 observaciones para un hotel urbano y un hotel resort, donde no seespecifica en que lugar del mundo se encuentran ubicado. Cada observación representa una reserva de hotel entreel 1 de julio de 2015 y el 31 de agosto de 2017, incluyendo la reserva que efectivamente llegó y la reserva que fuecancelada. Contenido: Dado que se trata de datos reales del hotel, se eliminaron todos los elementos de datos relacionados con laidentificación del hotel o del cliente. Se crearon y agregaron artificialmente al conjunto de datos cuatro columnas,'nombre', 'correo electrónico', 'número de teléfono' y 'tarjeta_de crédito'.  APRENDIZAJE Y TESTEO DE LOS MODELOSSe plantea el entrenamiento de 4 modelos diferentes para analizar su matriz de confusión y entender cuales el mas conveniente a usar EVALUACIÓN DE LOS DATOSAnálisis de matriz deconfusión BUSQUEDA DE VARIABLES DE DOMINIOSe agrega correlation filter para dejar que se busquen lasvariables objetivo y de dominio, descartando aquellas queacotarian el caso de estudio o que no tienen que ver con lasdemas variables. LECTURA DE DATASETInformación de loshotelesInformación de lasreservasInformación de lascancelaciones CORRECCIÓN DE DATOSEliminación de columnas innecesariasSe eliminan valores desconocidos de continentSe corrigen variables temporalesSi hay variables null, se le asigna 0 VISUALIZACIÓN DE DATOSLa idea de estos gráficos es poder ver lainformación una vez que se sanearon losdatosEntender mejor que es lo que se estáestudiando Lectura Archivo CSVSe eliminan las columnas innecesarias para el análisisSe elimina los valoresdesconocidos de "Continent"70% Learning30% TestingSe setea con valores "0"los valores nulos de las variables "Agent" y Children" test the modelNode 31Análisis de la salidaCorrige variable temporalSe da color para diferenciar en gráficos a los hotelesMuestra la distribución de cancelaciones por Hoteltrain the modelConversiónVariable Target"is_canceled"Node 48Node 50Node 51Node 59Node 60Split data into train and test setNode 71Node 73Node 74Node 75Node 86Node 87Node 88Node 89Node 90Node 91Node 92Node 93Node 94Node 95Node 96CSV Reader Column Filter Row Filter Partitioning Missing Value Random ForestPredictor Box Plot Box Plot Heatmap String to Date&Time Color Manager Pie Chart Random ForestLearner Number to String Scorer (JavaScript) Naive Bayes Learner Naive BayesPredictor DecisionTree Learner Decision TreePredictor Partitioning Scorer (JavaScript) Partitioning Normalizer Normalizer K Nearest Neighbor Partitioning Correlation Filter Linear Correlation Scorer (JavaScript) Scorer (JavaScript) k-Means Cluster Assigner Color Manager Scatter Plot DBSCAN Color Manager HierarchicalClustering 1% Contexto: Este conjunto de datos contiene 119390 observaciones para un hotel urbano y un hotel resort, donde no seespecifica en que lugar del mundo se encuentran ubicado. Cada observación representa una reserva de hotel entreel 1 de julio de 2015 y el 31 de agosto de 2017, incluyendo la reserva que efectivamente llegó y la reserva que fuecancelada. Contenido: Dado que se trata de datos reales del hotel, se eliminaron todos los elementos de datos relacionados con laidentificación del hotel o del cliente. Se crearon y agregaron artificialmente al conjunto de datos cuatro columnas,'nombre', 'correo electrónico', 'número de teléfono' y 'tarjeta_de crédito'.  APRENDIZAJE Y TESTEO DE LOS MODELOSSe plantea el entrenamiento de 4 modelos diferentes para analizar su matriz de confusión y entender cuales el mas conveniente a usar EVALUACIÓN DE LOS DATOSAnálisis de matriz deconfusión BUSQUEDA DE VARIABLES DE DOMINIOSe agrega correlation filter para dejar que se busquen lasvariables objetivo y de dominio, descartando aquellas queacotarian el caso de estudio o que no tienen que ver con lasdemas variables. LECTURA DE DATASETInformación de loshotelesInformación de lasreservasInformación de lascancelaciones CORRECCIÓN DE DATOSEliminación de columnas innecesariasSe eliminan valores desconocidos de continentSe corrigen variables temporalesSi hay variables null, se le asigna 0 VISUALIZACIÓN DE DATOSLa idea de estos gráficos es poder ver lainformación una vez que se sanearon losdatosEntender mejor que es lo que se estáestudiando Lectura Archivo CSVSe eliminan las columnas innecesarias para el análisisSe elimina los valoresdesconocidos de "Continent"70% Learning30% TestingSe setea con valores "0"los valores nulos de las variables "Agent" y Children" test the modelNode 31Análisis de la salidaCorrige variable temporalSe da color para diferenciar en gráficos a los hotelesMuestra la distribución de cancelaciones por Hoteltrain the modelConversiónVariable Target"is_canceled"Node 48Node 50Node 51Node 59Node 60Split data into train and test setNode 71Node 73Node 74Node 75Node 86Node 87Node 88Node 89Node 90Node 91Node 92Node 93Node 94Node 95Node 96CSV Reader Column Filter Row Filter Partitioning Missing Value Random ForestPredictor Box Plot Box Plot Heatmap String to Date&Time Color Manager Pie Chart Random ForestLearner Number to String Scorer (JavaScript) Naive Bayes Learner Naive BayesPredictor DecisionTree Learner Decision TreePredictor Partitioning Scorer (JavaScript) Partitioning Normalizer Normalizer K Nearest Neighbor Partitioning Correlation Filter Linear Correlation Scorer (JavaScript) Scorer (JavaScript) k-Means Cluster Assigner Color Manager Scatter Plot DBSCAN Color Manager HierarchicalClustering 1%

Nodes

Extensions

Links