Icon

XGB_​Base_​FINAL_​01_​pruebas_​de_​consistencia_​modelo

Subproceso 1 – Ingesta de datos de campo

Subproceso 1B – Análisis de correlación de variables

“Cálculo de la matriz de correlación entre las variables operativas/químicas y la velocidad de corrosión (MPY). Permite identificar qué variables están más asociadas a la corrosión interna dulce y priorizarlas en el modelado (fase CRISP‑DM: Data Understanding).”

Subproceso 1C – Visualización de patrones de corrosión por rangos



Subproceso 3 – Modelado y Evaluación del Modelo Predictivo (CRISP‑DM: Modeling & Evaluation)

Subproceso 2 – Preparación y Enriquecimiento de Datos (CRISP‑DM: Data Preparation)

Subproceso 3B – Auditoría del Modelo con Validación Cruzada (CRISP‑DM: Evaluation)

“Workflow CRISP‑DM para Predicción de la Velocidad de Corrosión Dulce Interna en Ductos del Campo Yapacaní mediante XGBoost”

“Asigna colores a cada rango de riesgo para diferenciar visualmente en los gráficos las condiciones operativas más críticas.”
Color Manager
“Grafica corrosión real vs predicha; la cercanía a la diagonal muestra el buen ajuste del modelo en el conjunto de prueba.”
Scatter Plot (JavaScript) (legacy)
“Agrupa variables numéricas en rangos de riesgo (bajo/medio/alto) para que la corrosión se analice por categorías fáciles de interpretar.”
Numeric Binner
“Calcula el residuo como diferencia entre corrosión real y predicha para analizar dónde el modelo se equivoca más.”
Math Formula
“Calcula las métricas del modelo en el test: R² = 0.865, MAE y RMSE, que cuantifican la precisión de las predicciones de corrosión.”
Numeric Scorer
“Divide la base en 80% entrenamiento y 20% prueba, simulando el escenario donde el modelo ve datos nuevos para medir generalización.”
Table Partitioner
“Ingesta de la base CSV con datos de operación, química y corrosión de los ductos (fase CRISP‑DM: Data Understanding / Data Preparation).”
CSV Reader
“Entrena el mismo modelo XGBoost sobre los datos de entrenamiento de cada fold para evaluar su rendimiento en distintas particiones.”
XGBoost Tree Ensemble Learner (Regression)
Linear Correlation
“Genera predicciones de velocidad de corrosión para los registros del fold de prueba en cada iteración de la validación cruzada.”
XGBoost Predictor (Regression)
“Ajusta dominios y tipos de datos para que todas las variables numéricas de operación y química queden listas para el modelado.”
Domain Calculator
“Calcula R², MAE y RMSE por fold; el R² medio ≈ 0.811 sirve como auditoría estadística de la estabilidad del modelo frente a diferentes cortes de los datos.”
Numeric Scorer
“Entrena el modelo XGBoost de regresión con las variables físicas, operativas y químicas para predecir la velocidad de corrosión dulce.”
XGBoost Tree Ensemble Learner (Regression)
“Muestra la relación entre las variables de proceso y la velocidad de corrosión, coloreando cada punto por rango de riesgo para identificar patrones y outliers.”
Scatter Plot
“Aplica el modelo entrenado al 20% de datos de prueba para generar las predicciones de velocidad de corrosión.”
XGBoost Predictor (Regression)
“Divide los datos en 5 folds para realizar validación cruzada, alternando qué parte se usa para entrenar y cuál para probar el modelo.”
X-Partitioner
“Grafica los residuos frente a las predicciones; una nube alrededor de cero sin patrones fuertes indica errores tipo ruido y buen comportamiento global.”
Scatter Plot (JavaScript) (legacy)

Nodes

Extensions

Links