3 Principal Linear Probabilidade Model (LPM) Problemas
Usando a técnica de mínimos quadrados ordinários (OLS) para estimar um modelo com uma variável dependente manequim é conhecido como a criação de um modelo linear de probabilidade,
ou LPM. LPMs não são perfeitos. Três problemas específicos podem surgir:Não normalidade do termo de erro
erros heterocedásticos
previsões potencialmente sem sentido
Não normalidade do termo de erro
A suposição de que o erro é normalmente distribuída é fundamental para a realização de testes de hipóteses depois de estimar o modelo econométrico.
O termo de erro de um LPM tem uma distribuição binomial em vez de uma distribuição normal. Isso implica que o tradicional t-testes de significância individual e F-testes de importância global são inválidos.
Como você pode ver, o termo de erro em um LPM tem um de dois valores possíveis para um determinado x valor. Um valor possível para o erro (Se Y = 1) é dada por A, e o outro valor possível para o erro (Se Y = 0) é dado por B. Consequentemente, é impossível para o termo de erro de ter uma distribuição normal.
Heteroskedasticity
O modelo de regressão linear clássico (CLRM) assume que o termo de erro é homocedásticos. A suposição de homocedasticidade é obrigado a provar que os estimadores de MQO são eficientes (ou melhor). A prova de que MQO estimadores são eficientes é um componente importante do teorema de Gauss-Markov. A presença de heterocedasticidade pode causar o teorema de Gauss-Markov a ser violados e levar a outras características indesejáveis para os estimadores de MQO.
O termo de erro em um LPM é heterocedásticos por causa da variância não é constante. Em vez disso, a variação de um termo de erro LPM depende do valor da variável independente (s).
Utilizando a estrutura do LPM, pode caracterizar a variância da sua termo de erro como segue
Uma vez que a variância do erro depende do valor de X, exibe heteroskedasticity em vez de homocedasticidade.
probabilidades previstas Unbounded
A lei de probabilidade mais básico afirma que a probabilidade de um evento ocorrer deve ser contido dentro do intervalo [0,1]. Mas a natureza do LPM é tal que não assegura esta lei fundamental da probabilidade é satisfeito. Embora a maioria das probabilidades previstas a partir de um LPM têm valores sensíveis (entre 0 e 1), alguns probabilidades previstas podem ter valores sem sentido que são menos do que 0 ou maior do que 1.
Dê uma olhada na figura a seguir e focar sua atenção sobre os segmentos da linha de regressão, onde a probabilidade condicional é maior do que 1 ou inferior a 0. Quando a variável dependente é contínua, você não precisa se preocupar com valores ilimitados para o meios de condicional. No entanto, variáveis dicotômicas são problemáticas porque os meios condicionais representam probabilidades condicionais. Interpretação probabilidades que não são delimitadas por 0 e 1 é difícil.
Você pode ver um exemplo desse problema com dados reais:
A maioria das probabilidades estimadas a partir da estimativa LPM estão contidos no intervalo [0,1], mas a probabilidade prevista para a sétima observação é negativo. Infelizmente, nada na estimativa de um LPM assegura que todas as probabilidades previstas ficar dentro de valores razoáveis.