Le choix d'un niveau de confiance pour un échantillon de la population

Dans les statistiques, chaque intervalle de confiance (et chaque marge d'erreur, d'ailleurs) a un pourcentage qui lui est associé, appelé un niveau de confiance. Ce pourcentage représente la façon dont vous êtes confiant que les résultats seront capturer le vrai paramètre de la population, selon le tirage au sort avec votre échantillon aléatoire.

Un niveau de confiance vous aide à gérer les autres résultats de l'échantillon possible que vous pourriez avez obtenu quand vous faites une estimation d'un paramètre en utilisant les données d'un seul échantillon. Si vous voulez représenter 95% des autres résultats possibles, votre niveau de confiance serait de 95%.

Quel est le niveau de confiance est généralement utilisé par les chercheurs? Les niveaux de confiance varie de 80% à 99%, avec un niveau de confiance la plus courante étant de 95%. Souvent, le choix particulier du niveau de confiance dépend de votre domaine d'études ou la revue vos résultats apparaissent dans. En fait, les statisticiens ont un dicton qui dit, “ Pourquoi les statisticiens aiment leur travail? Parce qu'ils doivent être correctes seulement 95% du temps ”. (Sorte de accrocheur, est-ce pas? Et nous allons voir les météorologues battre cela.)

La variabilité dans les résultats des échantillons est mesurée en termes de nombre d'erreurs standard. UN erreur standard est similaire à l'écart-type d'un ensemble de données, à l'exception d'une erreur standard applique à des moyens ou des pourcentages exemples que vous aurais pu si différents échantillons ont été prélevés des échantillons. (L'écart type applique aux individus et non des échantillons, bien que l'écart-type a un effet sur l'erreur-type.)

Les erreurs types sont les blocs de construction des intervalles de confiance. Un intervalle de confiance est une statistique plus ou moins une marge d'erreur, et la marge d'erreur est déterminé par le nombre d'erreurs standard dont vous avez besoin pour obtenir le niveau de confiance que vous voulez.

Chaque niveau de confiance a un nombre correspondant d'erreurs standards qui doivent être ajouté ou soustrait. Ce nombre d'erreurs standard est un appelé valeur critique. Dans une situation où vous utilisez un Z-Répartition de trouver le nombre d'erreurs standard, vous appelez la valeur critique de la z * -value (prononcé valeur de z-étoiles). Le tableau suivant présente une liste des z* -values ​​pour certains des niveaux de confiance les plus couramment utilisés.

Comme le niveau de confiance augmente, le nombre d'erreurs standards augmente, de sorte que la marge d'erreur augmente.

z*-valeurs pour différents niveaux de confiance
Un niveau de confiancez * -value
80%1,28
90%1.645 (par convention)
95%1,96
98%2.33
99%2.58

Notez que ces valeurs sont tirées de la (Z) distribution standard normale. La zone située entre chaque valeur de z * et le négatif de la valeur de z * est le pourcentage de confiance (environ). Par exemple, la zone comprise entre z * = 1,28 et z = -1,28 est d'environ 0,80. Ainsi ce tableau peut être étendu à d'autres pourcentages de confiance ainsi. Le graphique montre que les pourcentages de confiance les plus couramment utilisés.

Si vous voulez être plus de 95% confiants quant à vos résultats, vous devez additionner et soustraire plus de deux erreurs-types. Par exemple, à 99% en confiance, vous voulez ajouter et soustraire environ deux et demi erreurs standard pour obtenir votre marge d'erreur (2,58 pour être exact). Le niveau de confiance élevé, plus le z *-valeur, plus la marge d'erreur, et plus l'intervalle de confiance (en supposant que tout le monde reste le même). Vous devez payer un certain prix pour plus de confiance.

Une question fréquente chez les gens premier apprentissage sur les intervalles de confiance est, “ Pourquoi ne pas toujours choisir un intervalle de confiance de 100% ”?; Rappelez-vous, que l'intervalle de confiance donne une gamme de valeurs plausibles pour un paramètre de population inconnu. Supposons que le paramètre de la population souhaitée est la proportion de tous les adolescents qui possèdent un téléphone cellulaire. Quelle serait la gamme de proportions à être afin d'être sûr à 100% qu'il contient le vrai, proportion inconnue? L'intervalle devrait contenir toutes les proportions possibles. Oui, il faudrait aller tout le chemin de 0 à 1 (ce qui équivaut à 0% à 100%)! Mais qui est pas très utile dans circonscrire un ensemble de pratiques proportions.


» » » » Le choix d'un niveau de confiance pour un échantillon de la population