Cosa significano i livelli di significatività e i valori P nei test di ipotesi? Qual è la significatività statistica comunque? In questo post, continuerò a concentrarmi su concetti e grafici per aiutarti a ottenere una comprensione più intuitiva di come funzionano i test di ipotesi nelle statistiche.
Per dare vita, aggiungerò il livello di significatività e il valore P al grafico nel mio post precedente per eseguire una versione grafica del 1 campione t-test., È più facile capire quando puoi vedere cosa significa veramente il significato statistico!
Ecco dove abbiamo lasciato nel mio ultimo post. Vogliamo determinare se la nostra media del campione (330,6) indica che il costo energetico medio di quest’anno è significativamente diverso dal costo energetico medio dello scorso anno di $260.
Il diagramma di distribuzione di probabilità sopra mostra la distribuzione dei mezzi di campionamento che otterremmo assumendo che l’ipotesi nulla sia vera (media della popolazione = 260) e abbiamo ripetutamente disegnato un gran numero di campioni casuali.,
Ti ho lasciato con una domanda: dove disegniamo la linea per la significatività statistica sul grafico? Ora aggiungeremo il livello di significatività e il valore P, che sono gli strumenti decisionali di cui avremo bisogno.
Useremo questi strumenti per testare le seguenti ipotesi:
- Ipotesi nulla: La media della popolazione è uguale alla media ipotizzata (260).
- Ipotesi alternativa: La media della popolazione differisce dalla media ipotizzata (260).
Qual è il livello di significatività (Alfa)?,
Il livello di significatività, indicato anche come alfa o α, è la probabilità di rifiutare l’ipotesi nulla quando è vera. Ad esempio, un livello di significatività di 0,05 indica un rischio del 5% di concludere che esiste una differenza quando non esiste alcuna differenza effettiva.
Questi tipi di definizioni possono essere difficili da capire a causa della loro natura tecnica. Un’immagine rende i concetti molto più facili da comprendere!
Il livello di significatività determina quanto lontano dal valore di ipotesi nulla disegneremo quella linea sul grafico. Per tracciare un livello di significatività pari a 0.,05, abbiamo bisogno di ombreggiare il 5% della distribuzione che è più lontana dall’ipotesi nulla.
Nel grafico sopra, le due aree ombreggiate sono equidistanti dal valore di ipotesi nulla e ogni area ha una probabilità di 0,025, per un totale di 0,05. Nelle statistiche, chiamiamo queste aree ombreggiate la regione critica per un test a due code. Se la media della popolazione è 260, ci aspettiamo di ottenere una media campione che cade nella regione critica 5% del tempo., La regione critica definisce quanto lontano deve essere la nostra statistica campione dal valore di ipotesi nulla prima di poter dire che è abbastanza insolito da rifiutare l’ipotesi nulla.
La nostra media campione (330,6) rientra nella regione critica, il che indica che è statisticamente significativa al livello 0,05.
Possiamo anche vedere se è statisticamente significativo usando l’altro livello di significatività comune di 0.01.
Le due aree ombreggiate hanno ciascuna una probabilità di 0,005, che si somma a una probabilità totale di 0,01., Questa volta la nostra media campione non rientra nella regione critica e non riusciamo a respingere l’ipotesi nulla. Questo confronto mostra perché è necessario scegliere il livello di significatività prima di iniziare lo studio. Ti protegge dalla scelta di un livello di significato perché ti dà comodamente risultati significativi!
Grazie al grafico, siamo stati in grado di determinare che i nostri risultati sono statisticamente significativi al livello 0.05 senza utilizzare un valore P., Tuttavia, quando si utilizza l’output numerico prodotto dal software statistico, è necessario confrontare il valore P con il livello di significatività per effettuare questa determinazione.
Quali sono i valori P?
I valori P sono la probabilità di ottenere un effetto almeno estremo come quello nei dati di esempio, assumendo la verità dell’ipotesi nulla.
Questa definizione di valori P, sebbene tecnicamente corretta, è un po ‘ contorta. È più facile da capire con un grafico!,
Per tracciare il valore P per il nostro set di dati di esempio, dobbiamo determinare la distanza tra la media del campione e il valore di ipotesi nulla (330.6 – 260 = 70.6). Successivamente, possiamo tracciare la probabilità di ottenere una media campione che è almeno altrettanto estrema in entrambe le code della distribuzione (260 +/- 70.6).
Nel grafico sopra, le due aree ombreggiate hanno ciascuna una probabilità di 0,01556, per una probabilità totale 0,03112., Questa probabilità rappresenta la probabilità di ottenere una media campione che sia almeno estrema quanto la nostra media campione in entrambe le code della distribuzione se la media della popolazione è 260. Questo è il nostro valore P!
Quando un valore P è minore o uguale al livello di significatività, si rifiuta l’ipotesi nulla. Se prendiamo il valore P per il nostro esempio e lo confrontiamo con i livelli di significatività comuni, corrisponde ai risultati grafici precedenti. Il valore P di 0,03112 è statisticamente significativo a un livello alfa di 0,05, ma non al livello 0,01.
Se ci atteniamo a un livello di significatività di 0.,05, possiamo concludere che il costo medio dell’energia per la popolazione è superiore a 260.
Un errore comune è interpretare il valore P come la probabilità che l’ipotesi nulla sia vera. Per capire perché questa interpretazione non è corretta, si prega di leggere il mio post sul blog Come interpretare correttamente i valori P.
Discussione su risultati statisticamente significativi
Un test di ipotesi valuta due affermazioni che si escludono a vicenda su una popolazione per determinare quale istruzione è meglio supportata dai dati di esempio., Un risultato del test è statisticamente significativo quando la statistica del campione è abbastanza insolita rispetto all’ipotesi nulla da poter rifiutare l’ipotesi nulla per l’intera popolazione. “Abbastanza insolito” in un test di ipotesi è definito da:
- L’ipotesi che l’ipotesi nulla sia vera—i grafici sono centrati sul valore dell’ipotesi nulla.
- Il livello di significatività-fino a che punto tracciamo la linea per la regione critica?
- La nostra statistica campione-cade nella regione critica?,
Tieni presente che non esiste un livello di significatività magica che distingua tra gli studi che hanno un vero effetto e quelli che non lo fanno con una precisione del 100%. I valori alfa comuni di 0,05 e 0,01 sono semplicemente basati sulla tradizione. Per un livello di significatività di 0,05, aspettatevi di ottenere mezzi campione nella regione critica 5% del tempo in cui l’ipotesi nulla è vera. In questi casi, non saprai che l’ipotesi nulla è vera ma la rifiuterai perché la media del campione cade nella regione critica. Ecco perché il livello di significatività è anche indicato come un tasso di errore!,
Questo tipo di errore non implica che lo sperimentatore abbia fatto qualcosa di sbagliato o richieda altre spiegazioni insolite. I grafici mostrano che quando l’ipotesi nulla è vera, è possibile ottenere questi mezzi di campionamento insoliti per nessun motivo diverso da un errore di campionamento casuale. E ‘ solo la fortuna del sorteggio.
I livelli di significatività e i valori P sono strumenti importanti che consentono di quantificare e controllare questo tipo di errore in un test di ipotesi. L’utilizzo di questi strumenti per decidere quando rifiutare l’ipotesi nulla aumenta le possibilità di prendere la decisione corretta.,
Se ti piace questo post, potresti voler leggere gli altri post di questa serie che usano lo stesso framework grafico:
- Precedente: Perché dobbiamo usare i test di ipotesi
- Successivo: Intervalli di confidenza e livelli di confidenza
Se vuoi vedere come ho fatto questi grafici, leggi: Come creare una versione grafica del t-Test 1-campione.
Lascia un commento