Icon

SPO

Inženjering karakteristika - uvođenje novih kolona

Nove kolone na bazi pravila biznis logike

Diskretizacija

Redukcija dimenzionalnosti + primjer sa PCA

Čišćenje podataka

Fetching

Transformacija kolona

učitavanje dataseta iz fajla
CSV Reader
iniciajlni pogled na dataset
Statistics
market_period
Rule Engine
snake_case za sve kolone
Column Renamer
date_recorded u datetime format
String to Date&Time
sales_ratio u number (manualno jer problem s automatskim je zarez i hiljadicama
String to Number
dodane posebne kolone za dan, mjesec i godinu
Date&Time Part Extractor
uklanjanje duplikata po serial_number (id)
Duplicate Row Filter
regions
Rule Engine
invest_category
Rule Engine
uklanjanje nepotrebnih kolona: serial_number, date_recorded, address
Column Filter
trazenje redundantnosti u numerickim karakteristikama
Linear Correlation
price ranges binning na bazi sale_amount
Numeric Binner
year period binning na osnovu godine prodaje
Numeric Binner
parmaetri normalizacije
Normalizer (Apply)
smanjenje dimenzionalnosti sa 95% varijanse
PCA
neophodno za PCA
Normalizer
if corr > 0.95 ukloni
Correlation Filter
konfiguracija boje preko price_category
Color Manager
Unknown kategorije za nedostajuće vrijednosti u residential i property type
Missing Value
String Manipulation
2D vizualizacija nakon PCA
Scatter Plot
prikaz nakon uklonjenih duplikata
Statistics
log_sale
Math Formula
filtriranje nevažećih cijena (negativnih)
Row Filter
log_assessed
Math Formula
uklanjanje kolona sa >70% NaN
Column Filter
String Manipulation
izbacivanje sales_amount outliera
Numeric Outliers
pregled medijalne vrijednosti
Statistics
above_median
Math Formula
price_per_ratio
Math Formula
decade
Math Formula

Nodes

Extensions

Links