Que signifient les niveaux de signification et les valeurs de P dans les tests d’hypothèses? Quelle est la signification statistique de toute façon? Dans cet article, je vais continuer à me concentrer sur les concepts et les graphiques pour vous aider à acquérir une compréhension plus intuitive de la façon dont les tests d’hypothèse fonctionnent en statistique.
pour lui donner vie, je vais ajouter le niveau de signification et la valeur P au graphique dans mon post précédent afin d’effectuer une version graphique du test T 1 échantillon., Il est plus facile de comprendre quand vous pouvez voir ce que la signification statistique signifie vraiment!
Voici où nous nous sommes arrêtés dans mon dernier post. Nous voulons déterminer si la moyenne de notre échantillon (330,6) indique que le coût énergétique moyen de cette année est sensiblement différent du coût énergétique moyen de 260 $de l’an dernier.
le diagramme de distribution de probabilité ci-dessus montre la distribution des moyennes d’échantillon que nous obtiendrions en supposant que l’hypothèse nulle est vraie (moyenne de la population = 260) et nous avons tiré à plusieurs reprises un grand nombre d’échantillons aléatoires.,
je vous ai laissé une question: où tracer la ligne de signification statistique sur le graphique? Maintenant, nous allons ajouter le niveau de signification et la valeur P, qui sont les outils de prise de décision dont nous aurons besoin.
nous allons utiliser ces outils pour tester les hypothèses suivantes:
- hypothèse nulle: la moyenne de la population est égale à la moyenne hypothétique (260).
- hypothèse Alternative: la moyenne de la population diffère de la moyenne hypothétique (260).
Quel est le niveau de Signification (Alpha)?,
Le niveau de signification, également désigné comme l’alpha ou α, est la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie. Par exemple, un niveau de Signification de 0,05 indique un risque de 5% de conclure qu’une différence existe lorsqu’il n’y a pas de différence réelle.
Ces types de définitions peuvent être difficile à comprendre en raison de leur caractère technique. Une image rend les concepts beaucoup plus faciles à comprendre!
Le niveau de signification détermine à quelle distance de l’hypothèse nulle valeur, nous allons tracer cette ligne sur le graphique. Pour représenter graphiquement un niveau de Signification de 0.,05, nous devons ombrer les 5% de la distribution qui est la plus éloignée de l’hypothèse nulle.
dans le graphique ci-dessus, les deux zones ombrées sont équidistantes de la valeur de l’hypothèse nulle et chaque zone a une probabilité de 0,025, pour un total de 0,05. En statistiques, nous appelons ces zones ombrées la région critique pour un test à deux queues. Si la moyenne de la population est de 260, nous nous attendons à obtenir une moyenne d’échantillon qui tombe dans la région critique 5% du temps., La région critique définit à quelle distance Notre échantillon statistique doit être de la valeur de l’hypothèse nulle avant de pouvoir dire qu’il est assez inhabituel de rejeter l’hypothèse nulle.
la moyenne de notre échantillon (330,6) se situe dans la région critique, ce qui indique qu’elle est statistiquement significative au niveau de 0,05.
Nous pouvons également voir si elle est statistiquement significative en utilisant l’autre niveau de signification commun de 0,01.
Les deux zones ombrées ont chacune une probabilité de 0,005, ce qui équivaut à une probabilité totale de 0,01., Cette fois, notre moyenne d’échantillon ne tombe pas dans la région critique et nous ne rejetons pas l’hypothèse nulle. Cette comparaison montre pourquoi vous devez choisir votre niveau de signification avant de commencer votre étude. Il vous protège du choix d’un niveau de signification car il vous donne facilement des résultats significatifs!
grâce au graphique, nous avons pu déterminer que nos résultats sont statistiquement significatifs au niveau 0.05 sans utiliser de valeur P., Cependant, lorsque vous utilisez la sortie numérique produite par un logiciel statistique, vous devez comparer la valeur P à votre niveau de signification pour effectuer cette détermination.
Quelles Sont les valeurs de P?
Les valeurs P sont la probabilité d’obtenir un effet au moins aussi extrême que celui de votre échantillon de données, en supposant la vérité de l’hypothèse nulle.
cette définition des valeurs P, bien que techniquement correcte, est un peu compliquée. C’est plus facile à comprendre avec un graphique!,
pour représenter graphiquement la valeur P de notre ensemble de données d’exemple, nous devons déterminer la distance entre la moyenne de l’échantillon et la valeur de l’hypothèse nulle (330,6 – 260 = 70,6). Ensuite, nous pouvons représenter graphiquement la probabilité d’obtenir une moyenne d’échantillon au moins aussi extrême dans les deux queues de la distribution (260 +/- 70.6).
dans le graphique ci-dessus, les deux zones ombrées ont chacune une probabilité de 0,01556, pour une probabilité totale de 0,03112., Cette probabilité représente la probabilité d’obtenir une moyenne d’échantillon au moins aussi extrême que notre moyenne d’échantillon dans les deux queues de la distribution si la moyenne de la population est de 260. C’est notre valeur de P!
lorsqu’une valeur P est inférieure ou égale au niveau de signification, vous rejetez l’hypothèse nulle. Si nous prenons la valeur P pour notre exemple et la comparons aux niveaux de signification communs, elle correspond aux résultats graphiques précédents. La valeur P de 0,03112 est statistiquement significative à un niveau alpha de 0,05, mais pas à un niveau de 0,01.
Si nous en restons à un niveau de signification de 0.,05, nous pouvons conclure que le coût énergétique moyen pour la population est supérieur à 260.
Une erreur courante consiste à interpréter la valeur de P la probabilité que l’hypothèse nulle est vraie. Pour comprendre pourquoi cette interprétation est incorrecte, veuillez lire mon article de blog comment interpréter correctement les valeurs P.
Discussion sur les résultats statistiquement significatifs
Un test d’hypothèse évalue deux énoncés mutuellement exclusifs au sujet d’une population afin de déterminer quel énoncé est le mieux étayé par les données de l’échantillon., Un résultat de test est statistiquement significatif lorsque l’échantillon statistique est assez inhabituelle par rapport à l’hypothèse nulle que l’on peut rejeter l’hypothèse nulle pour l’ensemble de la population. « Assez inhabituelle” dans un test d’hypothèse est définie par:
- L’hypothèse que l’hypothèse nulle est vraie, les graphiques sont centrées sur l’hypothèse nulle valeur.
- Le niveau de signification – jusqu’où tracer la ligne pour la région critique?
- notre échantillon statistique-tombe-t-il dans la région critique?,
gardez à l’esprit qu’il n’y a pas de niveau de signification magique qui distingue entre les études qui ont un effet réel et celles qui ne le font pas avec une précision de 100%. Les valeurs alpha communes de 0,05 et 0,01 sont simplement basées sur la tradition. Pour un niveau de Signification de 0,05, attendez-vous à obtenir des moyennes d’échantillon dans la région critique 5% du temps où l’hypothèse nulle est vraie. Dans ces cas, vous ne saurez pas que l’hypothèse nulle est vraie mais vous la rejetterez car la moyenne de l’échantillon tombe dans la région critique. C’est pourquoi le niveau de signification est également appelé taux d’erreur!,
Ce type d’erreur n’implique pas que l’expérimentateur a fait quelque chose de mal ou nécessite une autre explication inhabituelle. Les graphiques montrent que, lorsque l’hypothèse nulle est vraie, il est possible d’obtenir ces inhabituelle échantillon moyen pour aucune autre raison que l’erreur d’échantillonnage aléatoire. C’est juste la chance du tirage au sort.
Les niveaux de signification et les valeurs P sont des outils importants qui vous aident à quantifier et à contrôler ce type d’erreur dans un test d’hypothèse. L’utilisation de ces outils pour décider quand rejeter l’hypothèse nulle augmente vos chances de prendre la bonne décision.,
Si vous aimez cet article, vous voudrez peut-être lire les autres articles de cette série qui utilisent le même cadre graphique:
- précédent: pourquoi nous devons utiliser des Tests D’hypothèses
- suivant: intervalles de confiance et niveaux de confiance
Si vous souhaitez voir comment j’ai fait ces graphiques, veuillez lire: comment créer une Version graphique du test t à 1 échantillon.
Laisser un commentaire