Como selecionar as variáveis ​​independentes para o seu modelo Econométrica

Uma das decisões mais importantes que você faz quando especificar o seu modelo econométrico é que as variáveis ​​para incluir como variáveis ​​independentes. Aqui, você descobrir o que problemas podem ocorrer se você incluir muito poucas ou muitas variáveis ​​independentes no seu modelo, e você ver como isso misspecification afeta seus resultados.

Omitindo variáveis ​​relevantes

Se uma variável que pertence no modelo é excluído da função de regressão estimados, o modelo é mal especificado e pode causar viés nos coeficientes estimados.

Você tem um viés de variável omitida se uma variável excluídos tem algum efeito (positivo ou negativo) sobre a variável dependente e está correlacionada com pelo menos uma das suas variáveis ​​independentes.

A natureza matemática do viés de especificação pode ser expressa através de um modelo simples. Suponha que o modelo população verdadeira é dada por

image0.png

Onde x1 e x2 são as duas variáveis ​​que afectam Y. Mas, devido à ignorância ou falta de dados, em vez você calcular essa regressão:

image1.png

que omite x2 a partir das variáveis ​​independentes. O valor esperado

image2.png

Nesta situação é

image3.png

Mas esta equação viola o teorema de Gauss-Markov porque

image4.png

A grandeza da polarização pode ser expressa como

image5.png

Onde

image6.png

Se o efeito de x2 em Y e

image7.png

é a inclinação desta regressão:

image8.png

que capta a correlação (positiva ou negativa) entre a variável (s) incluído e excluído.

Resumo de Bias variável omitida
Impacto da variável omitida sobre Variável DependenteCorrelação entre a variável incluída e omitido:
PositivoNegativo
Positivoviés positivoviés negativo
Negativoviés negativoviés positivo

Na prática, é provável que você tem algum viés de variável omitida porque é impossível controlar tudo o que afeta a variável dependente. No entanto, você pode aumentar suas chances de minimizar viés de variável omitida, evitando modelos de regressão simples (com uma variável independente) e incluindo as variáveis ​​que são susceptíveis de ser o mais importante, teoricamente (e, possivelmente, mas não necessariamente estatisticamente) para explicar a variável dependente .

A inclusão de variáveis ​​irrelevantes

Se uma variável não pertencem ao modelo e está incluída na função de regressão estimados, o modelo é overspecified. Se você overspecify o modelo de regressão através da inclusão de uma variável irrelevante, os coeficientes estimados permanecer imparcial. No entanto, ele tem um efeito indesejável de aumentar os erros padrão dos seus coeficientes.

Em um modelo de regressão simples (com uma variável independente), o erro padrão estimado do coeficiente de regressão x é

image9.png

Onde

image10.png

é a variância estimada do erro e

image11.png

é a variação total na X.

Se você incluir variáveis ​​independentes adicionais no modelo, o erro padrão estimado para um determinado coeficiente de regressão é dada por

image12.png

Onde

image13.png

é o R-quadrado da regressão de xk nas outras variáveis ​​independentes ou xs. Porque

image14.png

o numerador diminui. Uma variável irrelevante não ajuda a explicar qualquer da variação Y, -lo sem uma diminuição de compensação em

image15.png

os aumentos de erro padrão.

Só porque o seu coeficiente estimado não é estatisticamente significativa não significa que seja irrelevante. Um modelo bem especificado geralmente inclui algumas variáveis ​​que são estatisticamente significativos e algumas que não são. Além disso, as variáveis ​​que não são estatisticamente significativa pode contribuir variação explicada suficiente para ter qualquer impacto negativo sobre os erros padrão.

menu