La méthode bootstrap pour les erreurs standard et les intervalles de confiance

Vous pouvez calculer l'erreur standard (SE) et l'intervalle de confiance (IC) des échantillons statistiques les plus courants (moyennes, des proportions, des comptages d'événements et les tarifs, et les coefficients de régression). Mais une SE et CI existent (théoriquement, du moins) pour quelconque numéro que vous pourriez peut-être arracher à vos données - médianes, centiles, des coefficients de corrélation et d'autres quantités qui pourraient impliquer des calculs compliqués, comme la zone sous la courbe de concentration en fonction du temps (AUC) ou estimé la probabilité de survie à cinq ans provenant d'un l'analyse de survie. Formules pour la SE et CI autour de ces chiffres pourraient ne pas être disponibles ou peuvent être désespérément difficiles à évaluer. En outre, les formules qui existent pourraient appliquent uniquement aux nombres normalement distribuées, et vous pourriez ne pas être sûr de ce type de distribution de vos données suit.

Considérons un problème très simple. Supposons que vous avez mesuré le QI de 20 sujets et ont obtenu les résultats suivants: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120, et 138. Ces chiffres ont une moyenne de 100,85 et une médiane de 99,5. Parce que vous êtes un bon scientifique, vous savez que chaque fois que vous signalez un certain nombre que vous avez calculé à partir de vos données (comme un moyen ou médian), vous aurez également besoin d'indiquer la précision de cette valeur sous la forme d'une SE et CI.

Pour la moyenne, et si vous pouvez supposer que les valeurs de QI sont approximativement distribuées normalement, les choses sont assez simples. Vous pouvez calculer le SE de la moyenne que 3.54 et l'IC à 95% autour de la moyenne de 93,4 à 108,3.

Mais que dire de la SE et de CI pour la médiane, pour lesquels il n'y a pas de formules simples? Et si vous ne pouvez pas être sûr que ces valeurs de QI proviennent d'une distribution normale? Ensuite, les formules simples pourraient ne pas être fiables.

Heureusement, il existe une méthode très générale pour estimer les SE et de la CEI pour tout ce que vous pouvez calculer à partir de vos données, et il ne nécessite pas d'hypothèses sur la façon dont vos numéros sont distribués. Le SE d'un échantillon statistique est l'écart-type (SD) de la distribution d'échantillonnage pour cette statistique. Et les limites de confiance à 95% d'un échantillon statistique sont bien estimés par le 2,5e et 97,5e centiles de la distribution d'échantillonnage de cette statistique.

Donc, si vous pouviez reproduire l'ensemble de votre expérience plusieurs milliers de fois (en utilisant un autre échantillon de sujets à chaque fois), et chaque calculer de temps et de sauvegarder la valeur de la chose vous intéresse (médiane, AUC, ou autre), cette collection de des milliers de valeurs serait une très bonne approximation de la distribution d'échantillonnage de la quantité d'intérêt. Ensuite, vous pouvez estimer le SE simplement comme la SD de la distribution d'échantillonnage et les limites de confiance des centiles de la distribution.

Mais en réalité, la réalisation de ce scénario est impossible - vous avez probablement pas le temps, de la patience, ni l'argent pour effectuer vos milliers d'étude entières de fois. Heureusement, vous n'êtes pas obligé de répéter les milliers d'études de fois pour obtenir une estimation de la distribution d'échantillonnage. Vous pouvez le faire en réutilisant les données de votre une étude réelle, encore et encore! Cela peut sembler trop beau pour être vrai, et les statisticiens étaient très sceptiques de cette méthode quand il a été proposé. Ils ont appelé cela bootstrapping, la comparant à la tâche impossible de “ ramasser vous-même par les lacets ”.

Mais il se trouve que si vous continuez à réutiliser les mêmes données dans une certaine mesure, cette méthode fonctionne réellement. Au fil des ans, la procédure bootstrap est devenu un moyen accepté pour obtenir des estimations fiables de la PME et de la CEI pour presque tout ce que vous pouvez calculer à partir de votre de données en fait, il est souvent considéré comme le “ or la norme n ° 148; contre lequel différentes formules d'approximation pour les PE et les IC sont jugés.

Pour voir comment la méthode bootstrap fonctionne, voici comment vous pourriez l'utiliser pour estimer la SE et IC à 95% de la moyenne et la médiane des 20 valeurs de QI montrés plus tôt. Tu dois resample vos 20 numéros, encore et encore, de la manière suivante:

  1. Écrivez chacun de vos mesures sur un feuillet séparé de papier et de les mettre tous dans un sac.

    Dans cet exemple, vous écrivez les 20 QI mesurés sur des bouts distincts.

  2. Atteindre et tirer un feuillet, écrire ce nombre vers le bas, et mettre le glissement dans le sac.

    (Cette dernière partie est très important!)

  3. Répétez l'étape 2 autant de fois que nécessaire pour correspondre au nombre de mesures que vous avez, retour le glissement à la poche à chaque fois.

    Ceci est appelé rééchantillonnage avec ReplacemeNT, et elle produit une rééchantillonnée ensemble de données. Dans cet exemple, vous répétez l'étape 2 plus 19 fois, pour un total de 20 fois (ce qui est le nombre de mesures de QI que vous avez).

  4. Calculer la statistique souhaitée de l'échantillon des numéros rééchantillonnées des étapes 2 et 3, et enregistrer ce numéro.

    Dans cet exemple, vous trouvez la moyenne et la médiane des 20 numéros rééchantillonnées.

  5. Répétez les étapes 2 à 4 des milliers de fois.

    Chaque fois, vous générez un nouvel ensemble de données rééchantillonnée à partir duquel vous calculer et consigner les statistiques d'échantillon souhaité (dans ce cas, la moyenne et la médiane de l'ensemble de données rééchantillonnée). Vous vous retrouvez avec des milliers de valeurs de la moyenne et des milliers de valeurs de la médiane.

    Dans chaque ensemble de données rééchantillonnée, certaines des valeurs original peut se produire plus d'une fois, et certains peuvent ne pas être présent à tous. Presque chaque ensemble de données rééchantillonnée sera différent de tous les autres. Le procédé d'amorçage est basé sur le fait que ces valeurs moyennes et médianes des milliers de jeux de données rééchantillonnées comprend une bonne estimation de la distribution d'échantillonnage de la moyenne et de la médiane. Collectivement, ils ressemblent le genre de résultats que vous mai avoir obtenu si vous aviez répété votre étude réelle, encore et encore.

  6. Calculer l'écart type de vos milliers de valeurs de l'échantillon statistique.

    Ce processus vous donne une “ bootstrap ” estimation de la SE de l'échantillon statistique. Dans cet exemple, vous calculez la SD des milliers de moyens pour obtenir le SE de la moyenne, et vous calculez le SD des milliers de médianes pour obtenir le SE de la médiane.

  7. Obtenir le 2,5e et 97,5e centiles des milliers de valeurs de l'échantillon statistique.


    Vous faites cela en triant vos milliers de valeurs de l'échantillon statistique dans l'ordre numérique, puis coupant le plus bas de 2,5 pour cent et le plus élevé de 2,5 pour cent de l'ensemble trié de nombres. Les valeurs petites et plus grandes qui restent sont l'estimation bootstrap des limites de confiance de 95% inférieure et supérieure de l'échantillon statistique.

    Dans cet exemple, le 2,5e et 97,5e centiles des moyennes et médianes des milliers d'ensembles de données rééchantillonnées sont les limites de confiance à 95% pour la moyenne et la médiane, respectivement.

Évidemment, vous auriez jamais essayez de faire de ce processus d'amorçage à la main, mais il est assez facile à faire avec des logiciels comme le programme libre Statistics101. Vous pouvez entrer vos résultats observés et lui dire de générer, par exemple, 100.000 ensembles de données rééchantillonnées, calculer et enregistrer la moyenne et la médiane de chacun, et ensuite calculer la SD et la 2,5e et 97,5e centiles de ces 100.000 et 100.000 des moyens médianes. Voici quelques résultats d'une analyse effectuée sur cette bootstrap données:

Données réelles: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120, et 138. Moyenne = 99,5 100.85- Médian =
Réchantillonné Data Set #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114, et 120. Mean1 = 99,45, Médiane1 = 103.50
Réchantillonné Data Set #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114, et 138. Mean2 = 100,7, Médiane2 = 100,0
(Entre Set # 2 et la série suivante, 99,996 ensembles de données plus bootstrapped ont été générés.)
Réchantillonné Data Set #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120, et 138. Mean99999 = 99,45, Médiane99999 = 98.00
Réchantillonné Data Set #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120, et 138. Mean100000 = 97,7, Médiane100000 = 98,0

Voici un résumé des 100.000 rééchantillons:

  • Le SD des 100.000 signifiers = 3.46- tel est le bootstrap SE de la moyenne (SEM).

  • Le SD des 100.000 médianes = 4.24- tel est le bootstrap SE de la médiane.

  • Les 2,5e et 97,5e centiles de 100.000 moyens = 94,0 et 107.6- ce sont les limites de confiance à 95% pour le bootstrap signifier.

  • Les 2,5e et 97,5e centiles de 100.000 médianes = 92,5 et 108.5- ce sont les limites de confiance à 95% pour le bootstrap médiane.

Donc, vous devez déclarer votre moyenne et la médiane, avec des erreurs standard et 95% intervalle de confiance de cette façon leurs bootstrap:

Moyenne = 100.85 # 177- 3,46 (94.0-107.6) - médian = 99,5 # 177- 4,24 (92.5-108.5).

Vous remarquerez que la SE est plus grand (et le CI est plus large) pour la médiane que pour la moyenne. Ceci est généralement vrai pour les données normalement distribuées - la médiane a environ 25% plus de variabilité que la moyenne. Mais pour les données non normalement distribuées, la médiane est souvent plus précis que la moyenne.

Vous ne devez pas utiliser l'amorçage pour quelque chose d'aussi simple que la SE ou CI d'une moyenne, car il existe des formules simples pour cela. Mais la méthode bootstrap peut tout aussi facilement calculer la SE ou CI pour une médiane, un coefficient de corrélation, ou un paramètre pharmacocinétique comme l'ASC ou l'élimination La demi-vie d'un médicament, pour lesquels il n'y a pas de formules simples SE ou CI et pour qui les hypothèses de normalité pourraient ne pas appliquer.

Bootstrapping est conceptuellement simple, mais il est pas infaillible. La méthode implique certaines hypothèses et comporte certaines limites. Par exemple, il ne va probablement pas être très utile si vous avez seulement quelques valeurs observées. Voir des statistiques 101 pour plus d'informations sur l'utilisation de la méthode bootstrap (et pour le logiciel de Statistics101 libre pour faire les calculs de bootstrap très facilement).


» » » » La méthode bootstrap pour les erreurs standard et les intervalles de confiance