Introduzione alla statistica

Quale strada scegliere sulla base dei dati e degli obbiettivi ?

Numerico Continuo:

1. Età

2.Altezza

3.Peso

4.Gdp

5.Reddito

Obbiettivi

Comprendere se due campioni sono differenti in media o mediana. Esempio il campione A usa lo spazzolino morbido, il campione B lo spazzolino duro. Dopo un mese si contano le carie nei due gruppi e si testa se i due spazzolini hanno avuto la stessa efficacia.

OPPURE

Il campione si distribuisce come una funzione che desidero ?

Vantaggi:

Facilissima interpretazione, il risultato del test ci dice se è d’accordo o non in accordo (si rifiuta o non si rifiuta l’ipotesi del test).

Svantaggi:

Esistono infiniti test e talvolta sono fuorvianti, non tengono conto delle altre informazioni che hai nel tuo dataset.

Obbiettivo:

Desidero comprendere o prevedere una o più variabili del dataset

Modelli:

Ne esistono di molte tipologie, di seguito alcuni esempi di modelli sulla base della natura della Y (variabile che si desidera spiegare o stimare):

Y continua:

•Modello lineare

•Modello quantilico

•Modello poly

Y dicotomica:

•Logit

•Probit

•Machine learning

Y fattoriale:

•Multinomial (Logit, Probit, ecc…)

•Machine learning

Y continua con tempo:

•Arima

•Sarima

•Ar

•Ma

Articolo scritto in collaborazione con Paola Pozzolo