Spécification des fonctions non linéaires appropriées: les modèles probit et logit

Si votre résultat d'intérêt est qualitative, vous utilisez une variable dépendante mannequin et estimer la probabilité que le résultat (Y

Sommaire

= 1) se produit en utilisant votre modèle économétrique. Bien MCO peuvent être utilisés pour estimer un modèle avec une variable dépendante qualitative, cela doit se traduire dans un terme d'erreur qui est hétéroscédastique et ne sont pas normalement distribué.

Le problème le plus évident avec l'estimation d'un modèle variable dépendante fictive utilisant OLS est que les probabilités prédites ne sont pas garantis pour être dans le intervalle [0,1]. MCO ne peut pas être modifié pour répondre entièrement à cette question parce que la non-linéarité des paramètres est nécessaire afin de garantir que toutes les probabilités prédites ont des valeurs sensibles. Par conséquent, une autre spécification doit être utilisé. Économètres choisissent soit l'probit ou la fonction logit.

Avec une fonction de probit ou logit, les probabilités conditionnelles sont liées de façon non linéaire à la variable (s) indépendante. En outre, les deux fonctions ont la particularité d'aborder 0 et 1 progressivement (asymptotiquement), de sorte que les probabilités prédites sont toujours judicieux.

La figure illustre les probabilités conditionnelles d'un OLS (aussi connu comme le modèle de probabilité linéaire LPM), un probit, et un modèle logit.

image0.jpg

Travailler à partir de la CDF normale standard: Le modèle probit

Le modèle probit est basé sur la norme fonction normale de densité cumulative (CDF), qui est définie comme

image1.jpg

Z est une variable normale standardisée et e est la base du logarithme naturel (la valeur 2,71828...).

Dans un modèle de probit, la norme CDF normale remplace la fonction linéaire, de sorte que vous estimez

image2.jpg

Les termes de bêta ne peuvent être estimés par les MCO, si vous avez besoin d'utiliser une technique connue sous le nom plausibilité maximum (ML).

Pour toute donnée X, le modèle probit fournit la Z valeur pour l'observation. Le PDF normale standard ou CDF peuvent ensuite être utilisés pour obtenir la probabilité que Y = 1 pour cette observation.

La figure suivante montre comment s'y prendre pour trouver la probabilité pour une observation donnée.

image3.jpg

Après avoir estimé un modèle probit, la plupart des logiciels économétriques peut calculer les probabilités prévues pour toutes les observations de l'échantillon.

Fondant au large de la CDF logistique: Le modèle logit

Le modèle logit est basée sur la fonction de densité cumulative logistique (CDF), définie comme

image4.jpg

g est une variable aléatoire logistique et e est la base du logarithme naturel (la valeur 2,71828...).

La distribution logistique peut vous être inconnus, mais il est semblable à une normale standard. Cependant, il n'a moins de densité dans un écart type de la moyenne d'une distribution normale. La figure suivante illustre la différence entre le normal standard et les distributions logistiques.

image5.jpg

Dans un modèle logistique, la CDF logistique remplace la fonction linéaire de sorte que vous estimez

image6.jpg

Note: Vous ne pouvez pas utiliser MCO pour estimer la betas- la place, vous devez utiliser la technique du maximum de vraisemblance (ML).

Pour toute donnée X, le modèle logit fournit la valeur pour l'observation qui peut être utilisé avec la CDF logistique pour trouver la probabilité que Y = 1 pour cette observation.

La figure suivante illustre comment vous trouvez la probabilité pour une observation donnée.

image7.jpg

Lorsque vous avez votre modèle de logit estimatif, vous pouvez utiliser des logiciels tels que économétrique STATA pour calculer les probabilités prédites pour toutes vos observations de l'échantillon.


» » » » Spécification des fonctions non linéaires appropriées: les modèles probit et logit