Icon

OneHot Coding Process for Multivalue Variable Sample

OneHot Coding for Multivalue Variable Sample

This workflow illustrates the Multivalue OneHot Coding's implementation process. This OneHot coding is applied to the column named "genres" from a table created in KNIME (The column doesn't have missing values, but this condition is considered in the process, getting as result a string and a vector with only zero values without additional columns).

The defined prefix and suffix to name the coding's columns may be set at the Variable Creator's node. For example, a registered genre in the dataset is Adventure, therefore, its correspondent coding's column name is "hasActionAsGenre" in the sample.

The movies and genres lists were extracted from the IMDB 5000 Movie Dataset, the dataset is available in Kaggle at https://www.kaggle.com/datasets/carolzhangdc/imdb-5000-movie-dataset.

Creación deTabla de EjemploConstrucción deLlave Artificialpara Identificaciónde cada RegistroObtención deValores Únicosdel CampoSeleccionadoAsignación deNombres deColumna para cadaValor del CampoSeleccionadoProducto Cartesianodel Dataset con losnuevos Nombresde ColumnaAsignación deValores 0 ó 1 segúnConcordancia de losValores del CampoSeleccionadoConcatenación deValores deCodificación OneHotagrupado por FilaSeparación deValores deCodificación OneHoten CeldasSelección deColumnasNecesariasObtención deEncabezado deTabla deCodificación OneHotTabla con Asignaciónde Nombres deColumna para cadaValor del CampoSeleccionadoCorrección deEncabezado deTabla deCodificación OneHotTabla con ValoresOriginales del CampoSeleccionado y suRespectivaCodificación OneHotDeclaración deVariablesNecesariasSelección deColumnasNecesariasObtención deDescriptores deCodificación OneHotSelección deColumnasNecesariasSelección deValores No NulosConcatenaciónde Valores entodos los RegistrosSeparación deValores Individualesen CeldasObtención deValores Individualesen una solaColumnaMatching deValores Individualesen cada Registro(Inicio, Intermedio oFinal de Lista)Renombramientode ColumnasNecesariasTable Creator Math Formula GroupBy String Manipulation Cross Joiner Rule Engine GroupBy Cell Splitter Column Filter ExtractColumn Header Column Appender Insert ColumnHeader Column Appender Variable Creator Column Filter String Manipulation Column Filter Row Filter GroupBy Cell Splitter Transpose String Manipulation Column Rename Creación deTabla de EjemploConstrucción deLlave Artificialpara Identificaciónde cada RegistroObtención deValores Únicosdel CampoSeleccionadoAsignación deNombres deColumna para cadaValor del CampoSeleccionadoProducto Cartesianodel Dataset con losnuevos Nombresde ColumnaAsignación deValores 0 ó 1 segúnConcordancia de losValores del CampoSeleccionadoConcatenación deValores deCodificación OneHotagrupado por FilaSeparación deValores deCodificación OneHoten CeldasSelección deColumnasNecesariasObtención deEncabezado deTabla deCodificación OneHotTabla con Asignaciónde Nombres deColumna para cadaValor del CampoSeleccionadoCorrección deEncabezado deTabla deCodificación OneHotTabla con ValoresOriginales del CampoSeleccionado y suRespectivaCodificación OneHotDeclaración deVariablesNecesariasSelección deColumnasNecesariasObtención deDescriptores deCodificación OneHotSelección deColumnasNecesariasSelección deValores No NulosConcatenaciónde Valores entodos los RegistrosSeparación deValores Individualesen CeldasObtención deValores Individualesen una solaColumnaMatching deValores Individualesen cada Registro(Inicio, Intermedio oFinal de Lista)Renombramientode ColumnasNecesariasTable Creator Math Formula GroupBy String Manipulation Cross Joiner Rule Engine GroupBy Cell Splitter Column Filter ExtractColumn Header Column Appender Insert ColumnHeader Column Appender Variable Creator Column Filter String Manipulation Column Filter Row Filter GroupBy Cell Splitter Transpose String Manipulation Column Rename

Nodes

Extensions

Links