Icon

bigdata act2.knar

Carga y lectura del data set

Se comprueba que los valores de las variables categóricas están dentro de los valores aceptados.

Se buscan registros duplicados

Se comprueba el tipo de variable y si hay valores nulos

Se excluyen las columnas que no aportan información relevante o son redundantes.

Mediante el nodo Category to number, se intenta codificar la variable company_size de manera que represente el tamaño de la empresa en orden lógico (S<M<L). KNIME las ordena de forma alfabética por lo que se hace añadiendo una regla directamente.

CSV Reader
Missing Value
Value Counter
Normalizer
Se filtran los duplicados y chosen para ver si se encuentra algún patrón
Row Filter
Category to Number
Rule Engine
Duplicate Row Filter
Resultados con los años 2024 y 2025
Row Filter
Value Counter
Tabla 2. Distribución variable cuantitativa
Column Filter
Estatídsticos descriptivos de variables cuantitativas
Statistics
Outliers variable(salary_in_usd)
Numeric Outliers
Statistics
Tabla 3. Distribución variables cualitativas
Table View
Correlación variables
Linear Correlation
One to Many

Nodes

Extensions

Links