Especificando funções não-lineares adequados: Os Probit e Logit Models
Se o resultado de interesse é qualitativa, você usa uma variável dependente manequim e estimar a probabilidade de que o resultado (Y
Menu
O problema mais óbvio estimar um modelo variável dependente manequim usando OLS é que as probabilidades previstas não são garantidos para estar dentro do intervalo [0,1]. OLS não podem ser modificados para atender plenamente esta questão, porque não linearidade nos parâmetros é necessária a fim de garantir que todas as probabilidades previstas têm valores sensíveis. Consequentemente, uma especificação alternativa deve ser usada. Econometristas escolher o probit ou a função logit.
Com uma função probit ou logit, as probabilidades condicionais são não-linearmente relacionado com a variável independente (s). Além disso, ambas as funções, têm a característica de se aproximar de 0 e 1 gradualmente (assintoticamente), de modo que as probabilidades previstas são sempre sensível.
A figura ilustra as probabilidades condicionais de um OLS (também conhecido como o modelo linear de probabilidade LPM), um probit, logit e um modelo.
Trabalhando a partir do CDF normal padrão: O modelo probit
O modelo probit é baseado na função de densidade normal padrão cumulativa (CDF), que é definida como
Onde Z é uma variável normal padronizada e e é a base do log natural (o valor de 2,71828...).
Em um modelo probit, o CDF normal padrão substitui a função linear, de modo a estimar
Os termos beta não pode ser estimada utilizando OLS, então você precisa usar uma técnica conhecida como máxima verossimilhança (ML).
Para qualquer dado x, o modelo probit fornece o Z valor para a observação. A PDF normal padrão ou CDF pode então ser utilizado para obter a probabilidade de que Y = 1 para essa observação.
A figura a seguir mostra como fazer para encontrar a probabilidade para uma dada observação.
Depois de estimar um modelo probit, a maioria software econométrico pode calcular as probabilidades previstas para todas as observações da amostra.
Baseando-off do CDF logística: O modelo logit
O modelo logit é baseado na função de densidade cumulativa logística (CDF), definida como
Onde G é uma variável aleatória e logística e é a base do log natural (o valor de 2,71828...).
A distribuição logística pode ser estranho para você, mas é semelhante a um padrão normal. No entanto, tem menor densidade dentro de um desvio padrão da média de uma distribuição normal padrão. A figura a seguir ilustra a diferença entre o padrão normal e as distribuições de logística.
Em um modelo logit, o CDF logística substitui a função linear de modo que você estimar
Nota: Você não pode usar OLS para estimar o betas- em vez disso, você tem que usar a técnica de probabilidade máxima (ML).
Para qualquer dado x, o modelo logit fornece o valor para a observação de que pode ser usado com o CDF logística para determinar a probabilidade de que Y = 1 para essa observação.
A figura a seguir ilustra como você encontrar a probabilidade para uma dada observação.
Quando tiver o seu modelo logit estimado, você pode usar software econométrico, como STATA para calcular as probabilidades previstas para todas as suas observações da amostra.