Le théorème central limite: ce qui est assez grand

En un mot, le théorème central limite dit que vous pouvez utiliser la distribution normale pour décrire le comportement d'un échantillon signifie, même si les valeurs individuelles qui composent la moyenne de l'échantillon ne sont pas normaux eux-mêmes. Mais cela est seulement possible si la taille de l'échantillon est “ assez grand ”. Statistiques de nombreux manuels vous diraient que n

Sommaire

devra être d'au moins 30.

Mais pourquoi est- n = 30 l'indice de référence? De nombreuses variables dans la nature, de la finance et d'autres applications ont une distribution qui est très proche de la courbe normale. Par exemple, en examinant la t-table, vous voyez que les diverses valeurs de t commencer à être vraiment proche des valeurs de z au moment où vous frappez à environ 30 degrés de liberté. Une raison à cela est que le t-distributions et la répartition partagent deux caractéristiques normales importantes: Ils sont symétriques, et ils sont unimodales (ayant un pic).

Si la distribution de vos valeurs individuelles de données est loin de l'une de ces qualités, vous pourriez avoir besoin de plus qu'une taille de 30 de l'échantillon à utiliser le théorème central limite. Le plus loin les données est d'être symétrique et unimodale, les données plus vous aurez besoin.

Symétrie

Si vous savez ou soupçonnez que votre distribution parent est pas symétrique autour de la moyenne, alors vous pouvez avoir besoin d'une taille d'échantillon qui est significativement plus grande que 30 pour obtenir l'échantillon possible signifie regarder normale (et donc utiliser le théorème central limite).

Considérons la droite en suivant; histogramme asymétrique, qui enregistre le nombre d'animaux domestiques par ménage.

image0.jpg

Maintenant, supposons qu'il représente l'ensemble de la population des ménages. Vous répétée échantillon n = 30 ménages de cette population. Voici ce que la distribution de l'échantillon les moyens possibles ressemble.

image1.jpg

Vous pouvez voir que cette distribution est pas normal parce que la queue droite étend encore plus loin sur le pic central que la queue gauche fait. Il est pas symétrique. Pour cette population, vous devez prendre un échantillon d'environ n = 100 pour obtenir l'échantillon moyen de régler en une courbe symétrique.

image2.jpg

Unimodal


Si vous savez ou soupçonnez que votre distribution de parent est pas unimodale et a plus d'un pic, alors vous pourriez avoir besoin de plus de 30 dans votre échantillon de se sentir bien en utilisant le théorème central limite.

Considérons le multimodal histogramme de la population suit avec trois pics distincts.

image3.jpg

Si vous ne l'échantillon n = 30 de cette population, vous obtenez une distribution unimodale, mais il ya encore pas tout à fait symétrique.

image4.jpg

Pour cette population, vous devez prendre un échantillon d'au moins n = 50 à l'aise que votre moyenne de l'échantillon de distribution est à peu près normal.

image5.jpg

» » » » Le théorème central limite: ce qui est assez grand