Comment calculer une ligne de régression

Dans les statistiques, vous pouvez calculer une ligne de régression pour deux variables si leur nuage de points montre une tendance linéaire et la corrélation entre les variables est très forte (par exemple, r

Sommaire

= 0,98). Une ligne de régression est tout simplement une seule ligne qui correspond le mieux aux données (en termes d'avoir la distance totale la plus petite de la ligne aux points). Statisticiens appellent cette technique pour trouver la ligne la mieux ajustée d'un linéaire simple Une analyse de régression selon la méthode des moindres carrés.

Scatterplot du cricket gazouille par rapport à la température extérieure.
Scatterplot du cricket gazouille par rapport à la température extérieure.

La formule pour le la ligne de meilleur ajustement (ou ligne de régression) est y = mx + b, où m est la pente de la ligne et b est le y-interception. Cette équation lui-même est le même que celui utilisé pour trouver une ligne dans algebra- mais rappelez-vous, dans les statistiques les points ne se trouvent pas parfaitement sur une ligne - la ligne est un modèle autour duquel se trouvent les données si une forte tendance linéaire existe.

  • La pente d'une ligne représente la variation en Y au cours de la variation de la X. Par exemple, une pente de

    image1.jpg

    signifie que la X-valeur augmente (se déplace à droite) de 3 unités, la y-la valeur se déplace par 10 unités en moyenne.

  • La ordonnée à l'origine est la valeur sur l'axe des y, où la ligne traverse. Par exemple, dans l'équation y = 2X - 6, la ligne traverse la y-axe à la valeur b = -6. Les coordonnées de ce point sont (0, -6) - quand une ligne franchit le y-axe, la X-valeur est toujours 0.

Vous pensez peut-être que vous devez essayer des tas de différentes lignes pour trouver celui qui convient le mieux. Heureusement, vous avez une option plus simple (bien eyeballing une ligne sur le nuage de points ne vous aider à réfléchir à ce que vous attendez la réponse de l'être). La ligne de meilleur ajustement a une pente distincte et y-interception qui peut être calculé en utilisant les formules (et ces formules ne sont pas trop difficile à calculer).

Pour économiser beaucoup de temps de calcul la meilleure ligne de montage, d'abord trouver le “ big five, ” cinq statistiques sommaires que vous aurez besoin dans vos calculs:

  1. La moyenne de la X valeurs

    image2.jpg
  2. La moyenne de la y valeurs

    image3.jpg
  3. L'écart-type de la X des valeurs (notés sX)

  4. L'écart-type de la y des valeurs (notés sy)

  5. La corrélation entre X et Y (notée r)

Trouver la pente d'une droite de régression

La formule de la pente, m, de la ligne de meilleur ajustement est

image4.jpg

r est la corrélation entre X et Y, et sX et sy sont les écarts-types de la X-les valeurs et la y-valeurs, respectivement. Vous divisez simplement sy par sX et multiplier le résultat par r.

Notez que la pente de la droite de meilleur ajustement peut être un nombre négatif parce que la corrélation peut être un nombre négatif. Une pente négative indique que la ligne est en descente. Par exemple, si une augmentation des agents de police est liée à une diminution du nombre de crimes dans un FASHION- linéaire puis la corrélation et donc la pente de la droite de meilleur ajustement est négatif dans le cas présent.

La corrélation et la pente de la ligne de meilleur ajustement sont pas les mêmes. La formule pour la pente prend la corrélation (une mesure sans unité) et attache unités à elle. Penser à sy divisé par sX que la variation (ressemblant) dans Y au cours de la variation de X, en unités de X et Y. Par exemple, variation de température (degrés Fahrenheit) sur la variation du nombre de cricket gazouille (en 15 secondes).

Trouver l'ordonnée d'une ligne de régression

La formule pour le y-interception, b, de la ligne de meilleur ajustement est

image5.jpg

sont les moyens de la X-les valeurs et la y-les valeurs, respectivement, et m est la pente.

Donc, pour calculer la y-interception, b, de la ligne de meilleur ajustement, vous commencez par trouver la pente, m, de la ligne de meilleur ajustement en utilisant les étapes ci-dessus. Ensuite, pour trouver le y-intercepter, vous multipliez m par

image6.jpg

Toujours calculer la pente avant la y-interception. La formule pour le y-interception contient la pente!


» » » » Comment calculer une ligne de régression