L'idée de base d'une analyse de variance (Anova)

La dite “ analyse de la variance à un facteur ” (ANOVA) est utilisée lorsque l'on compare les trois ou plusieurs groupes de chiffres. Lorsque l'on compare seulement deux groupes (A et B), vous testez la différence (A - B) entre les deux groupes avec un test t de Student. Donc, lorsque l'on compare trois groupes (A, B, et C), il est naturel de penser à tester chacun des trois possibles les comparaisons à deux groupes (A - B, A - C et B - C) avec au test.

Mais l'exécution d'un ensemble exhaustif de tests t-deux du groupe peut être risqué, parce que le nombre de groupes augmente, le nombre de comparaisons à deux groupes remonte encore plus. La règle générale est que N groupes peuvent être jumelés à N(N - 1) / 2 manières différentes, donc dans une étude avec six groupes, vous auriez 6x5 / 2, ou 15 comparaisons à deux groupes différents.

Lorsque vous faites beaucoup de tests de signification, vous courez un risque accru de faire un Erreur de type I - faussement importance de conclure quand il n'y a pas d'effet réel présente. Ce type d'erreur est appelé aussi une alpha inflation. Donc, si vous voulez savoir si un tas de groupes ont tous des moyens cohérents ou si un ou plusieurs d'entre eux sont différents d'un ou plusieurs autres, vous avez besoin d'un unique test de production d'un unique valeur de p qui répond à cette question.

L'ANOVA à une voie est exactement ce genre de test. Il ne regarde pas les différences entre les paires du groupe se entend lieu, il examine comment l'ensemble de la collection du groupe signifie est étalée et la compare à combien vous pourriez attendre de ces moyens pour étaler si tous les groupes ont été échantillonnés à partir de la même population (qui est, si il n'y avait pas de véritables différences entre les groupes).

Le résultat de ce calcul est exprimé dans une statistique de test appelé le Rapport F (désigné simplement comme F), Le rapport de la quantité de variabilité il ya entre les groupes par rapport à combien il ya à l'intérieur les groupes.

Si l'hypothèse nulle est vraie (en d'autres termes, si aucune vraie différence existe entre les groupes), alors le ratio F devrait être proche de 1, et ses fluctuations d'échantillonnage devrait suivre la La distribution F de Fisher, qui est en fait une famille de fonctions de distribution caractérisées par deux nombres:

  • Les degrés de liberté du numérateur: Ce nombre est souvent désigné comme dfN ou df1, qui est un de moins que le nombre de groupes.

  • Les degrés de liberté du dénominateur: Ce nombre est désigné df ou df2, qui est le nombre total d'observations moins le nombre de groupes.

La valeur de p peut être calculée à partir des valeurs de F, df1, et df2, et le logiciel effectuer ce calcul pour vous. Si la valeur de p de l'analyse de la variance est significative (moins de 0,05 ou votre niveau d'alpha choisi), alors vous pouvez en conclure que les groupes sont pas tous la même (parce que les moyens varient les unes des autres par une quantité trop importante).


» » » » L'idée de base d'une analyse de variance (Anova)