Icon

04. Data Mining

Data Mining - Solution
Actividad II: Regresión Lineal - Leer los datos weather.table - Divida los datos en filas hasta 2016 (conjunto de entrenamiento) y filas a partir de 2017 (conjunto de prueba) - Entrene un modelo de regresión lineal que prediga AIR_TEMP como una función de todas las demás características delconjunto de datos. - Utilice el modelo para predecir la temperatura en 2017 y evalúe el modelo con el nodo Numeric Scorer- Opcional:1. Calcule la temperatura media por mes en los datos de entrenamiento.2. Unir la temperatura media mensual al conjunto de prueba.3. Utilice Numeric Scorer para ver si la temperatura mensual promedio proporciona una mejor predicción que el modelo deregresión lineal. Actividad III: k-Means - Leer los datos location_data.table- Filtrar los datos a las entradas de California (region_code = CA) - Construya una agrupación de k-medias con k = 3. Utilice solo la latitud y la longitud para la agrupación. - Opcional: Graficar la latitud y la longitud en una vista (mapa OSM o gráfico de dispersión) y usar la vista para optimizarvisualmente k Actividad I: Árboles de decisión - Particione los datos Fully Joined Data en un conjunto de entrenamiento y prueba (50%, muestreo estratificado en Target) - Entrene un árbol de decisión en el conjunto de entrenamiento para predecir Target - Utilice el modelo entrenado para predecir Target en el conjunto de prueba - Evaluar la precisión del modelo con el nodo Scorer - ¿Cuál es la precisión general de su modelo? - Opcional: evalúe la precisión y robustez del modelo con el nodo Curva ROC Leer weather.tableLocations_data Table Reader Table Reader Fully Joined Data Actividad II: Regresión Lineal - Leer los datos weather.table - Divida los datos en filas hasta 2016 (conjunto de entrenamiento) y filas a partir de 2017 (conjunto de prueba) - Entrene un modelo de regresión lineal que prediga AIR_TEMP como una función de todas las demás características delconjunto de datos. - Utilice el modelo para predecir la temperatura en 2017 y evalúe el modelo con el nodo Numeric Scorer- Opcional:1. Calcule la temperatura media por mes en los datos de entrenamiento.2. Unir la temperatura media mensual al conjunto de prueba.3. Utilice Numeric Scorer para ver si la temperatura mensual promedio proporciona una mejor predicción que el modelo deregresión lineal. Actividad III: k-Means - Leer los datos location_data.table- Filtrar los datos a las entradas de California (region_code = CA) - Construya una agrupación de k-medias con k = 3. Utilice solo la latitud y la longitud para la agrupación. - Opcional: Graficar la latitud y la longitud en una vista (mapa OSM o gráfico de dispersión) y usar la vista para optimizarvisualmente k Actividad I: Árboles de decisión - Particione los datos Fully Joined Data en un conjunto de entrenamiento y prueba (50%, muestreo estratificado en Target) - Entrene un árbol de decisión en el conjunto de entrenamiento para predecir Target - Utilice el modelo entrenado para predecir Target en el conjunto de prueba - Evaluar la precisión del modelo con el nodo Scorer - ¿Cuál es la precisión general de su modelo? - Opcional: evalúe la precisión y robustez del modelo con el nodo Curva ROC Leer weather.tableLocations_data Table Reader Table Reader Fully Joined Data

Nodes

Extensions

Links