Icon

Titanic_​RandomForest

<p>Este workflow es un reto publicado en Kaggle.com para predecir la supervivencia de una pasajero del Titanic según las variables relacionadas a su genero, edad, N° de Hijos y esposos y otras.</p><p>Se utiliza un modelo de RandomForest, realizando primero una visualización de los datos mediante el nodo GroupBy para sacar la media entre la superviviencia y otras variables. </p><p>Se realiza el procesamiento y limpieza de datos. Convirtiendo la variables de "Survived" de Integer a String con el propósito de ser la variable objetivo.</p><p>La configuración del modelo es: </p><p>El numero de estimadores es de 100 y la profundidad de las ramas es 10. </p><p>Se tiene como resultado una confiabilidad de la predicción de 0.804, validando que si tiene efecto algunas de las variables para sobrevivir al desastre.</p><p></p><p></p>

Nodes

Extensions

Links