Indice di concentrazione di Gini

A cosa serve?

L’indice o coefficiente di concentrazione di Gini è una misura di variabilità utilizzata per descrivere la distribuzione di variabili quantitative, come reddito, voto ai partiti politici, numero di impiegati in un’azienda o numero di studenti iscritti alle varie facoltà universitarie. Ad esempio, si può usare per capire se in un determinato Paese del mondo il reddito è distribuito in modo pressoché uguale tra i cittadini o se invece è concentrato nelle mani di pochi ricchi e, dunque, vi è una forte disuguaglianza.

Leggi tutto “Indice di concentrazione di Gini”

Indice di correlazione di Pearson

Indicatore della relazione lineare

È un indicatore che misura la relazione lineare, in termini di forza e direzione, tra due caratteri quantitativi X e Y. Si dice che tra X e Y vi è correlazione positiva o concordanza se crescono o decrescono contemporaneamente. Si ha correlazione negativa o discordanza quando al crescere di un carattere, l’altro tende a decrescere.

Leggi tutto “Indice di correlazione di Pearson”

Indici di valutazione del modello:

Come comprendere se un modello è valido

R2

Il coefficiente di determinazione (R quadro) è un indice che misura il legame tra la variabilità dei dati e la correttezza del modello statistico utilizzato. Esso è legato alla frazione della varianza non spiegata dal modello. Tale indice varia da 0 a 1, più si avvicina ad 1 più il modello riesce a spiegare i dati. Tale indice è solitamente utilizzato nei modelli di regressione lineare. R2 tende a sovrastimare la bontà del modello nel caso in cui il modello sia in overfitting, ovvero quando il modello ha troppe variabili X. Per correggere tale problematica solitamente si fa riferimento ad una correzione di tale indice chiamato “R2 corretto” che penalizza i modelli eccessivamente complessi.

Esempio:

Il seguente esempio analizza la relazione, tramite un modello lineare, tra peso e altezza.
Modello lineare
Leggi tutto “Indici di valutazione del modello:”