Icon

BG

Data Exploration

Data Cleaning and Preparation

Decision Models

Excel Reader
• Observou-se um dataset desequilibrado • A variável fraud_reported apresenta maior número de casos “N” do que “Y”
Value Counter
0 = Fraude1 = Não Fraude
Category to Number
Bar Chart
Dashboard
Numeric Outliers
property_damage
Rule Engine
Bar Chart
Rule Engine
Distribuição
Column Filter
collision_type
Rule Engine
• Os valores em falta da variável authorities_contacted foram substituídos por “None”, assumindo que nenhuma autoridade foi contactada
Missing Value
Foi aplicado um filtro de duplicados para garantir que não existem registos repetidos no dataset após a limpeza inicial
Duplicate Row Filter
police_report_available
Rule Engine
Foram selecionadas as variáveis finais em formato numérico para utilização nos modelos analíticos
Column Filter
Foi desenvolvido um modelo de Decision Tree para prever a variável fraud_reported. Os dados foram divididos em 70% para treino e 30% para teste, sendo aplicada normalização às variáveis numéricas contínuas. O modelo obteve uma accuracy de 78,26%, cla
Decision Tree
Rule Engine
Modelo 2
Outliers
Age_Class
Rule Engine
Row Filter
Só maiores de 18 tem carte de condução
Row Filter

Nodes

Extensions

Links