Icon

02 Limpiar y Estandarizar

Cleaning and Standardization - Exercise

This workflow shows a hands-on exercise in the L1-DS Introduction to KNIME Analytics Platform for Data Scientists - Basics course

Tarea 1: Filtrado de filas1. Leer el archivo adult.csv ejecutando el nodo CSV Reader2. Filtrar las filas en las que falte el estado civil3. Extraer las filas en las que - El estado civil es divorciado - El estado civil es nunca casado y la edad está entre 20 y 40 años (ambos incluidos) - La clase de trabajo empieza por "S Tarea 2: Filtrado de columnas1. Leer el archivo adult_education.table ejecutando el nodo Table Reader.2. Excluir la columna "education-num" - Manualmente - Incluyendo sólo columnas de tipo cadena Tarea 3: Transformación de datos1. Trabaje de nuevo con los datos adult.csv y cree una nueva columna "work-status"con el valor "full-time" si las horas de trabajo semanales son >=40 y "part-time" encaso contrario.2. Sustituya el guión de "Estados Unidos" por un espacio en la columna "país deorigen".3. Crear una nueva columna "ano de nacimiento" restando el número de edad de1994, que es el año en que se recogieron los datos. 4. OPCIONAL: Repita las tareas 3 y 4 con el nodo Column Expressions adult.csvLeeradult_education.table CSV Reader Table Reader Tarea 1: Filtrado de filas1. Leer el archivo adult.csv ejecutando el nodo CSV Reader2. Filtrar las filas en las que falte el estado civil3. Extraer las filas en las que - El estado civil es divorciado - El estado civil es nunca casado y la edad está entre 20 y 40 años (ambos incluidos) - La clase de trabajo empieza por "S Tarea 2: Filtrado de columnas1. Leer el archivo adult_education.table ejecutando el nodo Table Reader.2. Excluir la columna "education-num" - Manualmente - Incluyendo sólo columnas de tipo cadena Tarea 3: Transformación de datos1. Trabaje de nuevo con los datos adult.csv y cree una nueva columna "work-status"con el valor "full-time" si las horas de trabajo semanales son >=40 y "part-time" encaso contrario.2. Sustituya el guión de "Estados Unidos" por un espacio en la columna "país deorigen".3. Crear una nueva columna "ano de nacimiento" restando el número de edad de1994, que es el año en que se recogieron los datos. 4. OPCIONAL: Repita las tareas 3 y 4 con el nodo Column Expressions adult.csvLeeradult_education.table CSV Reader Table Reader

Nodes

Extensions

Links