Especificando funções não-lineares adequados: Os Probit e Logit Models

Se o resultado de interesse é qualitativa, você usa uma variável dependente manequim e estimar a probabilidade de que o resultado (Y

= 1) ocorre através do seu modelo econométrico. Embora OLS pode ser usado para estimar um modelo com uma variável dependente qualitativa, isso poderia resultar em um termo de erro que é heterocedásticos e normalmente não é distribuído.

O problema mais óbvio estimar um modelo variável dependente manequim usando OLS é que as probabilidades previstas não são garantidos para estar dentro do intervalo [0,1]. OLS não podem ser modificados para atender plenamente esta questão, porque não linearidade nos parâmetros é necessária a fim de garantir que todas as probabilidades previstas têm valores sensíveis. Consequentemente, uma especificação alternativa deve ser usada. Econometristas escolher o probit ou a função logit.

Com uma função probit ou logit, as probabilidades condicionais são não-linearmente relacionado com a variável independente (s). Além disso, ambas as funções, têm a característica de se aproximar de 0 e 1 gradualmente (assintoticamente), de modo que as probabilidades previstas são sempre sensível.

A figura ilustra as probabilidades condicionais de um OLS (também conhecido como o modelo linear de probabilidade LPM), um probit, logit e um modelo.

image0.jpg

Trabalhando a partir do CDF normal padrão: O modelo probit

O modelo probit é baseado na função de densidade normal padrão cumulativa (CDF), que é definida como

image1.jpg

Onde Z é uma variável normal padronizada e e é a base do log natural (o valor de 2,71828...).

Em um modelo probit, o CDF normal padrão substitui a função linear, de modo a estimar

image2.jpg

Os termos beta não pode ser estimada utilizando OLS, então você precisa usar uma técnica conhecida como máxima verossimilhança (ML).

Para qualquer dado x, o modelo probit fornece o Z valor para a observação. A PDF normal padrão ou CDF pode então ser utilizado para obter a probabilidade de que Y = 1 para essa observação.

A figura a seguir mostra como fazer para encontrar a probabilidade para uma dada observação.

image3.jpg

Depois de estimar um modelo probit, a maioria software econométrico pode calcular as probabilidades previstas para todas as observações da amostra.

Baseando-off do CDF logística: O modelo logit

O modelo logit é baseado na função de densidade cumulativa logística (CDF), definida como

image4.jpg

Onde G é uma variável aleatória e logística e é a base do log natural (o valor de 2,71828...).

A distribuição logística pode ser estranho para você, mas é semelhante a um padrão normal. No entanto, tem menor densidade dentro de um desvio padrão da média de uma distribuição normal padrão. A figura a seguir ilustra a diferença entre o padrão normal e as distribuições de logística.

image5.jpg

Em um modelo logit, o CDF logística substitui a função linear de modo que você estimar

image6.jpg

Nota: Você não pode usar OLS para estimar o betas- em vez disso, você tem que usar a técnica de probabilidade máxima (ML).

Para qualquer dado x, o modelo logit fornece o valor para a observação de que pode ser usado com o CDF logística para determinar a probabilidade de que Y = 1 para essa observação.

A figura a seguir ilustra como você encontrar a probabilidade para uma dada observação.

image7.jpg

Quando tiver o seu modelo logit estimado, você pode usar software econométrico, como STATA para calcular as probabilidades previstas para todas as suas observações da amostra.

menu