o que significam os níveis de significância e os valores P nos testes de hipótese? Afinal, o que é significado estatístico? Neste post, vou continuar a focar em conceitos e gráficos para ajudá-lo a obter uma compreensão mais intuitiva de como os testes de hipótese funcionam nas estatísticas.
para trazê-lo à vida, vou adicionar o nível de significância e o valor de P ao gráfico no meu post anterior, a fim de realizar uma versão gráfica do teste-T de 1 amostra., É mais fácil de entender quando você pode ver o significado estatístico realmente significa!foi aqui que ficámos no meu último post. Queremos determinar se a média da nossa amostra (330.6) indica que o custo médio de energia deste ano é significativamente diferente do custo médio de energia do ano passado de US $260.
A distribuição de probabilidade enredo acima mostra a distribuição das médias da amostra gostaríamos de obter sob o pressuposto de que a hipótese nula é verdadeira (média da população = 260) e nós repetidamente atraiu um grande número de amostras aleatórias.,
I left you with a question: where do we draw the line for statistical significance on the graph? Agora vamos adicionar o nível de significância e o valor P, Que são as ferramentas de tomada de decisão que vamos precisar.
usaremos estas ferramentas para testar as seguintes hipóteses:
- hipótese nula: a média da população é igual à média hipotética (260).hipótese alternativa: a média da população difere da média hipotética (260).
Qual é o nível de significância (Alfa)?,
o nível de significância, também denotado como alfa ou α, é a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Por exemplo, um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma diferença quando não há diferença real.estes tipos de definições podem ser difíceis de compreender devido à sua natureza técnica. Uma imagem torna os conceitos muito mais fáceis de compreender!
o nível de significância determina quão longe do valor da hipótese nula vamos desenhar essa linha no gráfico. Para apresentar um nível de significância de 0.,05, precisamos enrolar os 5% da distribuição que está mais longe da hipótese nula.
no gráfico acima, as duas áreas sombreadas são equidistantes do valor da hipótese nula e cada área tem uma probabilidade de 0,025, para um total de 0,05. Em estatística, chamamos a estas áreas sombreadas a região crítica para um teste de duas caudas. Se a média da população for de 260, esperamos obter uma amostra que caia na região crítica 5% do tempo., A região crítica define quão longe nossa estatística de amostra deve estar do valor da hipótese nula antes que possamos dizer que é incomum o suficiente para rejeitar a hipótese nula.
nossa média de amostra (330.6) está dentro da região crítica, o que indica que é estatisticamente significante no nível de 0,05.
também podemos ver se é estatisticamente significativo usando o outro nível de significância comum de 0,01.
As duas áreas sombreadas cada uma têm uma probabilidade de 0.005, o que se soma a uma probabilidade total de 0.01., Desta vez nossa amostra significa que não está dentro da região crítica e nós não rejeitamos a hipótese nula. Esta comparação mostra por que você precisa escolher o seu nível de significância antes de começar seu estudo. Ele protege você de escolher um nível de significância porque convenientemente lhe dá resultados significativos!
graças ao gráfico, fomos capazes de determinar que os nossos resultados são estatisticamente significativos no nível de 0,05 sem usar um valor de P., No entanto, quando você usa a saída numérica produzida por software estatístico, você vai precisar comparar o valor P com o seu nível de significância para fazer esta determinação.
quais são os valores de P?
valores-P são a probabilidade de obter um efeito pelo menos tão extremo como o dos seus dados de amostra, assumindo a verdade da hipótese nula.
esta definição de valores P, embora tecnicamente correta, é um pouco complicada. É mais fácil de entender com um gráfico!,
para graficar o valor P para o nosso conjunto de dados de exemplo, precisamos determinar a distância entre a média da amostra e o valor da hipótese nula (330.6 – 260 = 70.6). Em seguida, podemos graficar a probabilidade de obter uma amostra significa que é pelo menos tão extrema em ambas as caudas da distribuição (260 +/- 70.6).
no gráfico acima, as duas áreas sombreadas cada uma têm uma probabilidade de 0.01556, para uma probabilidade total de 0.03112., Esta probabilidade representa a probabilidade de obter uma amostra média que é pelo menos tão extrema quanto a média da nossa amostra em ambas as caudas da distribuição se a média da população for 260. É o nosso valor P!
Quando um valor P é menor ou igual ao nível de significância, você rejeita a hipótese nula. Se pegarmos o valor P para o nosso exemplo e o compararmos com os níveis de significância comum, ele corresponde aos resultados gráficos anteriores. O valor de P de 0, 03112 é estatisticamente significativo a um nível alfa de 0, 05, mas não ao nível de 0, 01.se nos mantivermos a um nível de significância de 0.,05, podemos concluir que o custo médio de energia para a população é superior a 260.
um erro comum é interpretar o valor P Como a probabilidade de que a hipótese nula é verdadeira. Para entender por que esta interpretação é incorreta, por favor leia meu post blog como interpretar corretamente os valores de P.
discussão sobre resultados estatisticamente significativos
um teste de hipótese avalia duas afirmações mutuamente exclusivas sobre uma população para determinar qual declaração é melhor suportada pelos dados da amostra., Um resultado de teste é estatisticamente significativo quando a estatística da amostra é incomum o suficiente em relação à hipótese nula de que podemos rejeitar a hipótese nula para toda a população. “Inusual enough” in a hypothesis test is defined by:
- the assumption that the null hypothesis is true—the graphs are centered on the null hypothesis value.
- o nível de significância – a que distância nós traçamos a linha para a região crítica?nossa estatística de amostra-ela cai na região crítica?,
tenha em mente que não há nível de significância mágica que distingue entre os estudos que têm um efeito verdadeiro e aqueles que não têm 100% de precisão. Os valores alfa comuns de 0,05 e 0,01 são simplesmente baseados na tradição. Para um nível de significância de 0,05, esperar obter meios de amostra na região crítica 5% do Tempo em que a hipótese nula é verdadeira. Nestes casos, você não vai saber que a hipótese nula é verdadeira, mas você vai rejeitá-la porque a média da amostra cai na região crítica. É por isso que o nível de significância também é referido como uma taxa de erro!,
Este tipo de erro não implica que o experimentador tenha feito algo de errado ou requeira qualquer outra explicação incomum. Os grafos mostram que quando a hipótese nula é verdadeira, é possível obter estes meios de amostra incomuns por nenhuma razão que não seja erro de amostragem aleatória. É apenas sorte de empate.os níveis de significância e os valores de P são ferramentas importantes que o ajudam a quantificar e controlar este tipo de erro num teste de hipótese. Usar essas ferramentas para decidir quando rejeitar a hipótese nula aumenta a chance de tomar a decisão correta.,
Se você gostou deste post, você pode querer ler os outros posts desta série que usam o mesmo gráfico quadro:
- Anterior: Por que Precisamos Usar Testes de Hipótese
- Seguinte: Intervalos de Confiança e os Níveis de Confiança
Se você quiser ver como eu fiz esses gráficos, por favor leia: Como Criar uma Versão Gráfica do 1-sample t-Test.
Deixe uma resposta