¿Qué significan los niveles de significación y los valores de P en las pruebas de hipótesis? ¿Qué es la significación estadística? En este post, continuaré enfocándome en conceptos y gráficos para ayudarte a obtener una comprensión más intuitiva de cómo funcionan las pruebas de hipótesis en las estadísticas.

para darle vida, agregaré el nivel de significación y el valor de P al gráfico en mi publicación anterior para realizar una versión gráfica de la prueba t de 1 muestra., Es más fácil de entender cuando se puede ver lo que realmente significa la significación estadística!

Aquí es donde lo dejamos en mi último post. Queremos determinar si nuestra media muestral (330.6) indica que el costo promedio de energía de este año es significativamente diferente del costo promedio de energía del año pasado de 2 260.

la gráfica de distribución de probabilidad anterior muestra la distribución de las medias de la muestra que obtendríamos bajo el supuesto de que la hipótesis nula es verdadera (media de la población = 260) y dibujamos repetidamente un gran número de muestras aleatorias.,

te dejé con una pregunta: ¿dónde dibujamos la línea de significación estadística en el gráfico? Ahora agregaremos el nivel de significancia y el valor P, que son las herramientas de toma de decisiones que necesitaremos.

usaremos estas herramientas para probar las siguientes hipótesis:

  • hipótesis nula: la media de la población es igual a la media hipotética (260).
  • hipótesis alternativa: la media poblacional difiere de la media hipotética (260).

¿Cuál es el nivel de significación (Alfa)?,

el nivel de significancia, también denotado como alfa o α, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Por ejemplo, un nivel de significación de 0,05 indica un riesgo del 5% de concluir que existe una diferencia cuando no hay diferencia real.

estos tipos de definiciones pueden ser difíciles de entender debido a su naturaleza técnica. ¡Una imagen hace que los conceptos sean mucho más fáciles de comprender!

el nivel de significación determina cuán lejos del valor de hipótesis nula dibujaremos esa línea en el gráfico. Para graficar un nivel de significancia de 0.,05, necesitamos sombrear el 5% de la distribución que está más lejos de la hipótesis nula.

en el gráfico anterior, las dos áreas sombreadas son equidistantes del valor de hipótesis nula y cada área tiene una probabilidad de 0.025, para un total de 0.05. En Estadística, llamamos a estas áreas sombreadas la región crítica para una prueba de dos colas. Si la media poblacional es de 260, esperaríamos obtener una media muestral que caiga en la región crítica el 5% del tiempo., La región crítica define cuán lejos debe estar nuestra estadística de muestra del valor de la hipótesis nula antes de que podamos decir que es lo suficientemente inusual como para rechazar la hipótesis nula.

Nuestra media muestral (330.6) está dentro de la región crítica, lo que indica que es estadísticamente significativa en el nivel de 0.05.

también podemos ver si es estadísticamente significativo utilizando el otro nivel de significación común de 0,01.

las dos áreas sombreadas tienen una probabilidad de 0.005, lo que suma una probabilidad total de 0.01., Esta vez nuestra media muestral no cae dentro de la región crítica y no rechazamos la hipótesis nula. Esta comparación muestra por qué necesita elegir su nivel de significación antes de comenzar su estudio. Le protege de elegir un nivel de importancia, ya que convenientemente le da resultados significativos!

gracias al gráfico, pudimos determinar que nuestros resultados son estadísticamente significativos en el nivel 0.05 sin usar un valor de P., Sin embargo, cuando se utiliza la salida numérica producida por el software estadístico, tendrá que comparar el valor de P a su nivel de significación para hacer esta determinación.

¿Qué son los valores de P?

los valores P son la probabilidad de obtener un efecto al menos tan extremo como el de los datos de la muestra, asumiendo la verdad de la hipótesis nula.

esta definición de los valores de P, aunque técnicamente correcta, es un poco enrevesada. Es más fácil de entender con un gráfico!,

para graficar el valor de P para nuestro conjunto de datos de ejemplo, necesitamos determinar la distancia entre la media de la muestra y el valor de hipótesis nula (330.6 – 260 = 70.6). A continuación, podemos graficar la probabilidad de obtener una media muestral que sea al menos igual de extrema en ambas colas de la distribución (260 +/- 70.6).

en el gráfico anterior, las dos áreas sombreadas tienen una probabilidad de 0.01556, para una probabilidad total de 0.03112., Esta probabilidad representa la probabilidad de obtener una media muestral que sea al menos tan extrema como nuestra media muestral en ambas colas de la distribución si la media poblacional es 260. ¡Ese es nuestro valor P!

Cuando un valor P es menor o igual al nivel de significación, se rechaza la hipótesis nula. Si tomamos el valor P para nuestro ejemplo y lo comparamos con los niveles de significación comunes, coincide con los resultados gráficos anteriores. El valor de P de 0.03112 es estadísticamente significativo en un nivel alfa de 0.05, pero no en el nivel de 0.01.

Si nos atenemos a un nivel de significación de 0.,05, podemos concluir que el costo medio de la energía para la población es superior a 260.

un error común es interpretar el valor P como la probabilidad de que la hipótesis nula sea verdadera. Para entender por qué esta interpretación es incorrecta, por favor lee mi artículo de blog Cómo interpretar correctamente los valores P.

discusión sobre resultados estadísticamente significativos

una prueba de hipótesis evalúa dos afirmaciones mutuamente excluyentes sobre una población para determinar qué afirmación es mejor apoyada por los datos de la muestra., Un resultado de la prueba es estadísticamente significativo cuando la estadística de la muestra es lo suficientemente inusual en relación con la hipótesis nula que podemos rechazar la hipótesis nula para toda la población. «Lo suficientemente inusual» en una prueba de hipótesis se define por:

  • La suposición de que la hipótesis nula es verdadera—los gráficos se centran en el valor de la hipótesis nula.
  • El nivel de significancia – ¿hasta dónde trazamos la línea para la región crítica?
  • nuestra estadística de muestra – ¿cae en la región crítica?,

tenga en cuenta que no hay un nivel de significado mágico que distinga entre los estudios que tienen un efecto real y aquellos que no lo tienen con 100% de precisión. Los valores alfa comunes de 0.05 y 0.01 se basan simplemente en la tradición. Para un nivel de significancia de 0,05, esperar obtener Medias muestrales en la región crítica 5% del tiempo cuando la hipótesis nula es verdadera. En estos casos, no sabrá que la hipótesis nula es verdadera, pero la rechazará porque la media de la muestra cae en la región crítica. Es por eso que el nivel de importancia también se conoce como una tasa de error!,

este tipo de error no implica que el experimentador hizo algo malo o requiere cualquier otra explicación inusual. Los gráficos muestran que cuando la hipótesis nula es verdadera, es posible obtener estas medias de muestra inusuales sin otra razón que el error de muestreo aleatorio. Es sólo suerte del sorteo.

Los niveles de significación y los valores de P son herramientas importantes que ayudan a cuantificar y controlar este tipo de error en una prueba de hipótesis. El uso de estas herramientas para decidir cuándo rechazar la hipótesis nula aumenta su probabilidad de tomar la decisión correcta.,

si te gusta este post, es posible que quieras leer los otros posts de esta serie que usan el mismo marco gráfico:

  • anterior: por qué necesitamos usar pruebas de hipótesis
  • siguiente: intervalos de confianza y niveles de confianza

si quieres ver cómo Hice estos gráficos, lee: Cómo crear una versión gráfica de la prueba t de 1 muestra.