Carga y lectura del data set
Se comprueba que los valores de las variables categóricas están dentro de los valores aceptados.
Se buscan registros duplicados
Se comprueba el tipo de variable y si hay valores nulos
Se excluyen las columnas que no aportan información relevante o son redundantes.
Mediante el nodo Category to number, se intenta codificar la variable company_size de manera que represente el tamaño de la empresa en orden lógico (S<M<L). KNIME las ordena de forma alfabética por lo que se hace añadiendo una regla directamente.
To use this workflow in KNIME, download it from the below URL and open it in KNIME:
Deploy, schedule, execute, and monitor your KNIME workflows locally, in the cloud or on-premises – with our brand new NodePit Runner.