Icon

Semana 2 - Primer ejercicio - Clasificación - 04_​Machine Learning

Objetivo: entrenar y evaluar un modelo de clasificación.


Descripción:

Utilizaremos un conjunto de datos de transacciones de cliente. Las transacciones incluyen, entre otros: nombre de cliente, edad, ciudad, correo electrónico, identificación de cliente, número de orden, producto comprado, tienda donde se compró, fecha, precio. Recordar que RowID es simplemente un identificador de registro en la tabla de datos.

Las transacciones se cargan desde un Excel en el metanodo Loading Customer Data, donde además se agrega la información del programa de fidelización.

La actividad consiste en entrenar un modelo de clasificación para predecir el estado de membresía (Member o Gold). Entrenaremos y evaluaremos un modelo de tipo decision tree.

Cargar los datos del cliente

El metanodo Loading Customer Data lee los datos de transacciones de clientes y los datos de membresía de dos fuentes. El conjunto de datos resultante contiene la información del cliente.

  • n_items: número de ítemes únicos comprados

  • Total spending

  • City

  • Newsletter: suscripción a boletín

  • Customer group: CC1, CC2, o CC3 es el grupo de cliente

  • Status: es el estado de membresía, Member o Gold

  • Loyalty points



Clasificación del Estado de Membresía



Assessing the model fit
Scorer
Decision Tree Learner
Plotting ROC curve
ROC Curve
Decision Tree Predictor
Removing Customer ID
Column Filter
Training:Testing70:30Stratified on status
Table Partitioner
Loading Customer Data

Nodes

Extensions

Links