Icon

TizianoSaveUs 333

RATING SYSTEM APPLICATION L'idea applicativa è la seguente.1. banca ha i dati di società X e vuole sapere che a che classe di rischio appartiene2. banca da società x in pasto a XGBoost,il che significa che XGBoost trainato su questo dataset deve applicare quanto ha imparato alla socieà X per prevederne la Probabilità di Default3. XGBoost restituirà una probabilità di fallimento (PD) da assegnare alla società X4. Si assegna la società X alla classe di rischio Z in base alla sua probabilità di default.Dunque, il nostro drago XGBoost pazzo malato deve essere lo stesso che troviamo in Tree Based Models. Ho necessità di una porta output di tipo modello, in modo tale che wrt nodo di rating:- input (1) modello già allenato - input (2) dataset (Nel dataset puoi avere sia una società che un insieme di società, è il soggetto/insiemi di soggetti a cui la banca vuole assegnare un rating)- nodo di XGBoost predictor prende il modello da input 1 e il dataset da input 2 (non ha più senso parlare di training e testing perché ora il modello deve effettivamente predire nel mondo reale, nel quale purtoppo l'unica certezza èl'incertezza)Le variabili selezionate sono ovviamente quelle di XGBoost trainato in "Models with Validation" esportate automaticamente attraverso la porta di input "quadratino grigio"ATTENZIONE: la porta di output di "Tree Based Models" è specifica per XGBoost. Qualora dovessimo scegliere un altro modello bisogna riconfigurare la porta di uscita di tutti i metanodi. Stesso discorso per la porta di input di "Rating Model" TREE-BASED MODELS METANODEOutput port 1 : Concatenated AUC and Accuracy measuresfrom all the tree based modelsOutput port 2: Feature Importance measures from best modelOutput port 3: Trained best model (learner output)Output port 4: Testing Set MODELS EVALUATION ANDCOMPARISON Domain cleaning and verification for every attributeDataset for training, validating and testingthe model(5th Year)Node 3- Redundant Data Removal - Missing Values general treatment- Descriptive Statistics- Missing Values- Outliers- Correlation Matrix- Class BalanceANOVA test on Outliers distribution- C4.5- Random forest- Ensemble Tree learner- Gradient Boosting- XGBoost - Without Regularization- With Lasso RegularizationEvaluates allmodels performancesAll models comparisonDataset to be predictedDomain cleaning and verification for every attribute- Redundant Data Removal - Missing Values general treatment Input port: Feature Importance measures from best modelInput port 1: Trained best model (learner output)Input port 2: Testing SetInput port 3: Entire dataset after general data preparationInput port 1: Best Model ChosenInput port 2: Dataset to be predictedShow companies whose values needto be reenteredattr cleaning CSV Reader String To Number Number To String General DataPreparation Data_Understanding Bivariate Analysis Tree-Based Models Logistic Regression Concatenate InteractiveTable (local) CSV Reader attr cleaning String To Number Number To String General DataPreparation Feature selectedby best model Threshold tominimize total cost Rating Model InteractiveTable (local) RATING SYSTEM APPLICATION L'idea applicativa è la seguente.1. banca ha i dati di società X e vuole sapere che a che classe di rischio appartiene2. banca da società x in pasto a XGBoost,il che significa che XGBoost trainato su questo dataset deve applicare quanto ha imparato alla socieà X per prevederne la Probabilità di Default3. XGBoost restituirà una probabilità di fallimento (PD) da assegnare alla società X4. Si assegna la società X alla classe di rischio Z in base alla sua probabilità di default.Dunque, il nostro drago XGBoost pazzo malato deve essere lo stesso che troviamo in Tree Based Models. Ho necessità di una porta output di tipo modello, in modo tale che wrt nodo di rating:- input (1) modello già allenato - input (2) dataset (Nel dataset puoi avere sia una società che un insieme di società, è il soggetto/insiemi di soggetti a cui la banca vuole assegnare un rating)- nodo di XGBoost predictor prende il modello da input 1 e il dataset da input 2 (non ha più senso parlare di training e testing perché ora il modello deve effettivamente predire nel mondo reale, nel quale purtoppo l'unica certezza èl'incertezza)Le variabili selezionate sono ovviamente quelle di XGBoost trainato in "Models with Validation" esportate automaticamente attraverso la porta di input "quadratino grigio"ATTENZIONE: la porta di output di "Tree Based Models" è specifica per XGBoost. Qualora dovessimo scegliere un altro modello bisogna riconfigurare la porta di uscita di tutti i metanodi. Stesso discorso per la porta di input di "Rating Model" TREE-BASED MODELS METANODEOutput port 1 : Concatenated AUC and Accuracy measuresfrom all the tree based modelsOutput port 2: Feature Importance measures from best modelOutput port 3: Trained best model (learner output)Output port 4: Testing Set MODELS EVALUATION ANDCOMPARISON Domain cleaning and verification for every attributeDataset for training, validating and testingthe model(5th Year)Node 3- Redundant Data Removal - Missing Values general treatment- Descriptive Statistics- Missing Values- Outliers- Correlation Matrix- Class BalanceANOVA test on Outliers distribution- C4.5- Random forest- Ensemble Tree learner- Gradient Boosting- XGBoost - Without Regularization- With Lasso RegularizationEvaluates allmodels performancesAll models comparisonDataset to be predictedDomain cleaning and verification for every attribute- Redundant Data Removal - Missing Values general treatment Input port: Feature Importance measures from best modelInput port 1: Trained best model (learner output)Input port 2: Testing SetInput port 3: Entire dataset after general data preparationInput port 1: Best Model ChosenInput port 2: Dataset to be predictedShow companies whose values needto be reenteredattr cleaning CSV Reader String To Number Number To String General DataPreparation Data_Understanding Bivariate Analysis Tree-Based Models Logistic Regression Concatenate InteractiveTable (local) CSV Reader attr cleaning String To Number Number To String General DataPreparation Feature selectedby best model Threshold tominimize total cost Rating Model InteractiveTable (local)

Nodes

Extensions

Links