Il metodo SMOTE (Synthetic Minority Over-sampling Technique) viene utilizzato per affrontare il problema dei dataset sbilanciati, generando esempi sintetici della classe minoritaria al fine di bilanciare la distribuzione delle classi e migliorare le prestazioni dei modelli di apprendimento automatico.
Funzionamento:
Per ogni punto della classe minoritaria, trova i k vicini più simili (nearest neighbors).
Crea nuovi punti “sintetici” lungo la linea che li collega ai vicini.
Aumenta così il numero di esempi della classe minoritaria.
Il nodo X-Partitioner in KNIME serve a suddividere un dataset in più partizioni, permettendo di elaborare ciascun sotto-flusso separatamente, utile per Creare esperimenti separati per ciascun gruppo. Esempio: allenare un modello per ogni categoria, per ogni regione, o per ogni classe target., con la possibilità di aggregare i risultati successivamente tramite X-Aggregator.
Il Data Explorer è uno strumento utilizzato per analizzare e visualizzare rapidamente un dataset, permettendo di rilevare anomalie, valori mancanti, statistiche descrittive e distribuzioni, al fine di comprendere meglio i dati e guidare le operazioni di preprocessing e modellazione.
To use this workflow in KNIME, download it from the below URL and open it in KNIME:
Deploy, schedule, execute, and monitor your KNIME workflows locally, in the cloud or on-premises – with our brand new NodePit Runner.