Icon

02 Limpiar y Estandarizar - Solucion

Cleaning and Standardization - Exercise (Solution)

This workflow shows a solution to a hands-on exercise in the L1-DS Introduction to KNIME Analytics Platform for Data Scientists - Basics course

Tarea 1: Filtrado de filas1. Leer el archivo adult.csv ejecutando el nodo CSV Reader2. Filtrar las filas en las que falte el estado civil3. Extraer las filas en las que - El estado civil es divorciado - El estado civil es nunca casado y la edad está entre 20 y 40 años (ambos incluidos) - La clase de trabajo empieza por "S Tarea 2: Filtrado de columnas1. Leer el archivo adult_education.table ejecutando el nodo Table Reader.2. Excluir la columna "education-num" - Manualmente - Manual Selection - Incluyendo sólo columnas de tipo cadena - Type Selection Tarea 3: Transformación de datos1. Trabaje de nuevo con los datos adult.csv y cree una nueva columna "work-status"con el valor "full-time" si las horas de trabajo semanales son >=40 y "part-time" encaso contrario.2. Sustituya el guión de "Estados Unidos" por un espacio en la columna "país deorigen".3. Crear una nueva columna "year-of-birth" (ano de nacimiento) restando la edad a1994, que es el año en que se recogieron los datos. 4. OPCIONAL: Repita las tareas 3 y 4 con el nodo Column Expressions Filtrar filas en las que faltael valor en la columna marital statusFiltrar DivorcedFiltrar Workclass starts with "S"Filtrar Never-marriedNunca se casaron y tienen entre 20 y 40 añosExcluir education-nummanualmenteExcluir education-numa partir de type selectionadult.csvLeeradult_education.tableCrear la columnawork statusReemplazar "-"por "" en la columna native countrycolumnayear-of-birth Completar las mismastareas del flujo de arriba Row Filter Row Filter Row Filter Row Filter Row Filter Column Filter Column Filter CSV Reader Table Reader Rule Engine String Manipulation Math Formula Column Expressions Tarea 1: Filtrado de filas1. Leer el archivo adult.csv ejecutando el nodo CSV Reader2. Filtrar las filas en las que falte el estado civil3. Extraer las filas en las que - El estado civil es divorciado - El estado civil es nunca casado y la edad está entre 20 y 40 años (ambos incluidos) - La clase de trabajo empieza por "S Tarea 2: Filtrado de columnas1. Leer el archivo adult_education.table ejecutando el nodo Table Reader.2. Excluir la columna "education-num" - Manualmente - Manual Selection - Incluyendo sólo columnas de tipo cadena - Type Selection Tarea 3: Transformación de datos1. Trabaje de nuevo con los datos adult.csv y cree una nueva columna "work-status"con el valor "full-time" si las horas de trabajo semanales son >=40 y "part-time" encaso contrario.2. Sustituya el guión de "Estados Unidos" por un espacio en la columna "país deorigen".3. Crear una nueva columna "year-of-birth" (ano de nacimiento) restando la edad a1994, que es el año en que se recogieron los datos. 4. OPCIONAL: Repita las tareas 3 y 4 con el nodo Column Expressions Filtrar filas en las que faltael valor en la columna marital statusFiltrar DivorcedFiltrar Workclass starts with "S"Filtrar Never-marriedNunca se casaron y tienen entre 20 y 40 añosExcluir education-nummanualmenteExcluir education-numa partir de type selectionadult.csvLeeradult_education.tableCrear la columnawork statusReemplazar "-"por "" en la columna native countrycolumnayear-of-birth Completar las mismastareas del flujo de arriba Row Filter Row Filter Row Filter Row Filter Row Filter Column Filter Column Filter CSV Reader Table Reader Rule Engine String Manipulation Math Formula Column Expressions

Nodes

Extensions

Links