Quale strada scegliere sulla base dei dati e degli obbiettivi ?
Numerico Continuo:
1. Età
2.Altezza
3.Peso
4.Gdp
5.Reddito
Obbiettivi
Comprendere se due campioni sono differenti in media o mediana. Esempio il campione A usa lo spazzolino morbido, il campione B lo spazzolino duro. Dopo un mese si contano le carie nei due gruppi e si testa se i due spazzolini hanno avuto la stessa efficacia.
OPPURE
Il campione si distribuisce come una funzione che desidero ?
Vantaggi:
Facilissima interpretazione, il risultato del test ci dice se è d’accordo o non in accordo (si rifiuta o non si rifiuta l’ipotesi del test).
Svantaggi:
Esistono infiniti test e talvolta sono fuorvianti, non tengono conto delle altre informazioni che hai nel tuo dataset.
Obbiettivo:
Desidero comprendere o prevedere una o più variabili del dataset
Modelli:
Ne esistono di molte tipologie, di seguito alcuni esempi di modelli sulla base della natura della Y (variabile che si desidera spiegare o stimare):
Y continua:
•Modello lineare
•Modello quantilico
•Modello poly
Y dicotomica:
•Logit
•Probit
•Machine learning
Y fattoriale:
•Multinomial (Logit, Probit, ecc…)
•Machine learning
Y continua con tempo:
•Arima
•Sarima
•Ar
•Ma
Articolo scritto in collaborazione con Paola Pozzolo