ce înseamnă nivelurile de semnificație și valorile P în testele de ipoteză? Care este semnificația statistică oricum? În această postare, voi continua să mă concentrez pe concepte și grafice pentru a vă ajuta să obțineți o înțelegere mai intuitivă a modului în care testele de ipoteze funcționează în statistici.

pentru a-l aduce la viață, voi adăuga nivelul de semnificație și valoarea P la graficul din postarea mea anterioară pentru a efectua o versiune grafică a probei 1 T-test., Este mai ușor de înțeles când puteți vedea ce semnificație statistică înseamnă cu adevărat!

Iată unde am rămas în ultima mea postare. Vrem să determinăm dacă media eșantionului nostru (330.6) indică faptul că costul mediu al energiei din acest an este semnificativ diferit de costul mediu al energiei de anul trecut de 260 USD.

graficul de distribuție a probabilității de mai sus arată distribuția eșantionului înseamnă că am obține presupunând că ipoteza nulă este adevărată (media populației = 260) și am atras în mod repetat un număr mare de eșantioane aleatorii.,

v-am lăsat cu o întrebare: unde tragem linia pentru semnificația statistică pe grafic? Acum vom adăuga nivelul de semnificație și valoarea P, care sunt instrumentele de luare a deciziilor de care vom avea nevoie.vom folosi aceste instrumente pentru a testa următoarele ipoteze:

  • ipoteza nulă: media populației este egală cu media ipotezată (260).
  • ipoteză alternativă: media populației diferă de media ipotezată (260).

care este nivelul de semnificație (Alfa)?,

nivelul de semnificație, denumit și alfa sau α, este probabilitatea respingerii ipotezei nule atunci când este adevărat. De exemplu, un nivel de semnificație de 0,05 indică un risc de 5% de a concluziona că există o diferență atunci când nu există nicio diferență reală.aceste tipuri de definiții pot fi greu de înțeles din cauza naturii lor tehnice. O imagine face conceptele mult mai ușor de înțeles!

nivelul de semnificație determină cât de departe de valoarea ipotezei nule vom trage acea linie pe grafic. Pentru a Grafic un nivel de semnificație de 0.,05, trebuie să umbrim 5% din distribuție care este mai departe de ipoteza nulă.în graficul de mai sus, cele două zone umbrite sunt echidistante față de valoarea ipotezei nule și fiecare zonă are o probabilitate de 0,025, pentru un total de 0,05. În statistici, numim aceste zone umbrite Regiunea critică pentru un test cu două cozi. Dacă media populației este de 260, ne-am aștepta să obținem o medie a eșantionului care se încadrează în regiunea critică 5% din timp., Regiunea critică definește cât de departe trebuie să fie statistica eșantionului nostru de valoarea ipotezei nule înainte de a putea spune că este suficient de neobișnuit să respingem ipoteza nulă.

media eșantionului nostru (330.6) se încadrează în regiunea critică, ceea ce indică faptul că este semnificativ statistic la nivelul 0.05.de asemenea, putem vedea dacă este semnificativ statistic folosind celălalt nivel de semnificație comun de 0,01.cele două zone umbrite au fiecare o probabilitate de 0,005, ceea ce însumează o probabilitate totală de 0,01., De data aceasta eșantionul nostru nu se încadrează în regiunea critică și nu reușim să respingem ipoteza nulă. Această comparație arată de ce trebuie să alegeți nivelul de semnificație înainte de a începe studiul. Vă protejează de alegerea unui nivel de semnificație, deoarece vă oferă în mod convenabil rezultate semnificative!

datorită graficului, am putut determina că rezultatele noastre sunt semnificative statistic la nivelul 0.05 fără a utiliza o valoare P., Cu toate acestea, atunci când utilizați ieșirea numerică produsă de software-ul statistic, va trebui să comparați valoarea P cu nivelul dvs. de semnificație pentru a face această determinare.

care sunt valorile P?

Valorile P sunt probabilitatea de a obține un efect cel puțin la fel de extrem ca cel din datele dvs. de probă, presupunând adevărul ipotezei nule.această definiție a valorilor P, deși este corectă din punct de vedere tehnic, este puțin complicată. Este mai ușor de înțeles cu un grafic!,

pentru a graficul valoarea P pentru setul nostru de date de exemplu, trebuie să determinăm distanța dintre media eșantionului și valoarea ipotezei nule (330.6 – 260 = 70.6). Apoi, putem grafic probabilitatea de a obține un eșantion înseamnă că este cel puțin la fel de extremă în ambele cozi de distribuție (260 +/- 70.6).în graficul de mai sus, cele două zone umbrite au fiecare o probabilitate de 0,01556, pentru o probabilitate totală de 0,03112., Această probabilitate reprezintă probabilitatea de a obține o medie a eșantionului care este cel puțin la fel de extremă ca media eșantionului nostru în ambele cozi ale distribuției dacă media populației este 260. Asta e valoarea noastră P!

când o valoare P este mai mică sau egală cu nivelul de semnificație, respingeți ipoteza nulă. Dacă luăm valoarea P pentru exemplul nostru și o comparăm cu nivelurile de semnificație comune, aceasta se potrivește cu rezultatele grafice anterioare. Valoarea P de 0,03112 este semnificativă statistic la un nivel alfa de 0,05, dar nu la nivelul 0,01.dacă rămânem la un nivel de semnificație de 0.,05, putem concluziona că costul mediu al energiei pentru populație este mai mare de 260.o greșeală obișnuită este interpretarea valorii P ca probabilitatea ca ipoteza nulă să fie adevărată. Pentru a înțelege de ce această interpretare este incorectă, vă rugăm să citiți postarea pe blog Cum să interpretați corect valorile P.

discuție despre rezultate semnificative statistic

un test de ipoteză evaluează două afirmații care se exclud reciproc despre o populație pentru a determina care afirmație este cel mai bine susținută de datele din eșantion., Un rezultat al testului este semnificativ statistic atunci când statistica eșantionului este destul de neobișnuită în raport cu ipoteza nulă că putem respinge ipoteza nulă pentru întreaga populație. „Destul de neobișnuit” într—un test de ipoteză este definit de:

  • presupunerea că ipoteza nulă este adevărată-graficele sunt centrate pe valoarea ipotezei nule.
  • nivelul de semnificație—cât de departe tragem linia pentru regiunea critică?
  • statistica eșantionului nostru—se încadrează în regiunea critică?,rețineți că nu există un nivel de semnificație magică care să facă distincția între studiile care au un efect adevărat și cele care nu au o precizie de 100%. Valorile alfa comune de 0,05 și 0,01 se bazează pur și simplu pe tradiție. Pentru un nivel de semnificație de 0,05, așteptați să obțineți mijloace de probă în regiunea critică 5% din momentul în care ipoteza nulă este adevărată. În aceste cazuri, nu veți ști că ipoteza nulă este adevărată, dar o veți respinge, deoarece media eșantionului se încadrează în regiunea critică. De aceea, nivelul de semnificație este denumit și rata de eroare!,

    acest tip de eroare nu implică faptul că experimentatorul a făcut ceva greșit sau necesită orice altă explicație neobișnuită. Graficele arată că, atunci când ipoteza nulă este adevărată, este posibil să se obțină aceste mijloace de probă neobișnuite fără alt motiv decât eroarea de eșantionare aleatorie. E doar norocul tragerii la sorți.

    nivelurile de semnificație și valorile P sunt instrumente importante care vă ajută să cuantificați și să controlați acest tip de eroare într-un test de ipoteză. Utilizarea acestor instrumente pentru a decide când să respingeți ipoteza nulă crește șansa dvs. de a lua decizia corectă.,

    Dacă vă place acest post, ați putea dori să citiți alte posturi din această serie, care folosesc același grafic-cadru:

    • Anterior: de Ce Avem Nevoie pentru a Utiliza Ipoteze
    • Următoarele: Intervalele de Încredere și Nivelul de Încredere

    Dacă vrei să vezi cum am făcut aceste grafice, vă rugăm să citiți: Cum de a Crea o Versiune Grafică a 1-sample t-Test.