Como selecionar as variáveis independentes para o seu modelo Econométrica
Uma das decisões mais importantes que você faz quando especificar o seu modelo econométrico é que as variáveis para incluir como variáveis independentes. Aqui, você descobrir o que problemas podem ocorrer se você incluir muito poucas ou muitas variáveis independentes no seu modelo, e você ver como isso misspecification afeta seus resultados.
Omitindo variáveis relevantes
Se uma variável que pertence no modelo é excluído da função de regressão estimados, o modelo é mal especificado e pode causar viés nos coeficientes estimados.
Você tem um viés de variável omitida se uma variável excluídos tem algum efeito (positivo ou negativo) sobre a variável dependente e está correlacionada com pelo menos uma das suas variáveis independentes.
A natureza matemática do viés de especificação pode ser expressa através de um modelo simples. Suponha que o modelo população verdadeira é dada por
Onde x1 e x2 são as duas variáveis que afectam Y. Mas, devido à ignorância ou falta de dados, em vez você calcular essa regressão:
que omite x2 a partir das variáveis independentes. O valor esperado
Nesta situação é
Mas esta equação viola o teorema de Gauss-Markov porque
A grandeza da polarização pode ser expressa como
Onde
Se o efeito de x2 em Y e
é a inclinação desta regressão:
que capta a correlação (positiva ou negativa) entre a variável (s) incluído e excluído.
Impacto da variável omitida sobre Variável Dependente | Correlação entre a variável incluída e omitido: | |
---|---|---|
Positivo | Negativo | |
Positivo | viés positivo | viés negativo |
Negativo | viés negativo | viés positivo |
Na prática, é provável que você tem algum viés de variável omitida porque é impossível controlar tudo o que afeta a variável dependente. No entanto, você pode aumentar suas chances de minimizar viés de variável omitida, evitando modelos de regressão simples (com uma variável independente) e incluindo as variáveis que são susceptíveis de ser o mais importante, teoricamente (e, possivelmente, mas não necessariamente estatisticamente) para explicar a variável dependente .
A inclusão de variáveis irrelevantes
Se uma variável não pertencem ao modelo e está incluída na função de regressão estimados, o modelo é overspecified. Se você overspecify o modelo de regressão através da inclusão de uma variável irrelevante, os coeficientes estimados permanecer imparcial. No entanto, ele tem um efeito indesejável de aumentar os erros padrão dos seus coeficientes.
Em um modelo de regressão simples (com uma variável independente), o erro padrão estimado do coeficiente de regressão x é
Onde
é a variância estimada do erro e
é a variação total na X.
Se você incluir variáveis independentes adicionais no modelo, o erro padrão estimado para um determinado coeficiente de regressão é dada por
Onde
é o R-quadrado da regressão de xk nas outras variáveis independentes ou xs. Porque
o numerador diminui. Uma variável irrelevante não ajuda a explicar qualquer da variação Y, -lo sem uma diminuição de compensação em
os aumentos de erro padrão.
Só porque o seu coeficiente estimado não é estatisticamente significativa não significa que seja irrelevante. Um modelo bem especificado geralmente inclui algumas variáveis que são estatisticamente significativos e algumas que não são. Além disso, as variáveis que não são estatisticamente significativa pode contribuir variação explicada suficiente para ter qualquer impacto negativo sobre os erros padrão.