Aplicação de métodos estatísticos para os problemas económicos

Econometria alunos sempre apreciar uma revisão dos conceitos estatísticos que são mais importantes para o sucesso com econometria. Especificamente, você precisa estar confortável com distribuições de probabilidades, o cálculo das estatísticas descritivas e testes de hipóteses.

Sua capacidade de quantificar com precisão as relações econômicas depende não apenas de suas habilidades de construção de modelos econométricos, mas também sobre a qualidade dos dados que você está usando para análise e a sua capacidade para adoptar as estratégias adequadas para modelos de estimativas que são susceptíveis de violar uma suposição estatística . Os dados devem ser derivadas de um processo de coleta confiável, mas você também deve estar ciente de quaisquer limitações ou desafios adicionais.

Eles podem incluir, mas não estão limitados a

  • Agregação de dados: A informação que pode ter se originado em um agregado familiar, nível individual, ou empresa está sendo medido a uma cidade, município, estado ou nível de país em seus dados.

  • Estatisticamente correlacionadas mas economicamente irrelevantes variáveis: Alguns conjuntos de dados contêm uma abundância de informações, mas muitas das variáveis ​​pode não ter nada a ver com a questão econômica você está esperando para resolver.

  • Dados qualitativos: conjuntos de dados ricos geralmente incluem variáveis ​​qualitativas (informação geográfica, raça e assim por diante), mas esta informação requer tratamento especial antes que você possa usá-lo em um modelo econométrico.

  • Classical modelo de regressão linear (CLRM) falha suposição: A legitimidade da sua abordagem econométrica sempre repousa sobre um conjunto de pressupostos estatísticos, mas é provável que você achar que pelo menos um destes pressupostos não se sustenta (o que significa que não é verdade para os seus dados).

Econometristas diferenciar-se dos estatísticos, enfatizando violações das suposições estatísticas que são frequentemente tomadas para concedido. A técnica mais comum para estimar um modelo econométrico é Mínimos Quadrados Ordinários (MQO). No entanto, uma série de suposições CLRM deve manter em ordem para a técnica de OLS para fornecer estimativas confiáveis. Na prática, os pressupostos que têm mais probabilidade de falhar depender de seus dados e aplicações específicas.

Reconhecendo a importância do tipo de dados, a frequência e agregação

Os dados que você usa para estimar e testar o seu modelo econométrico é normalmente classificada em um dos três tipos possíveis:

  • transversal: Este tipo de dados consiste em medidas para observações individuais (pessoas, famílias, empresas, municípios, estados, países, ou qualquer outro) em um determinado ponto no tempo.

  • séries temporais: Este tipo de dados consiste em medições em uma ou mais variáveis ​​(como o produto interno bruto, as taxas de juros ou taxas de desemprego) ao longo do tempo em um determinado espaço (como um país específico ou estado).

  • Painel ou longitudinal: Este tipo de dados é constituído por uma série tempo para cada unidade de corte transversal da amostra. Os dados contêm medidas para observações individuais (pessoas, famílias, empresas, municípios, estados, países, e assim por diante) durante um período de tempo (dias, meses, trimestres ou anos).

O tipo de dados que você está usando pode influenciar a forma como você estima o seu modelo econométrico. Em particular, técnicas especializadas geralmente são obrigados a lidar com dados de séries temporais e de painel.

Você pode antecipar problemas econométricos comuns porque certas falhas CLRM suposição é mais provável com determinados tipos de dados. Dois casos típicos de falhas suposição CLRM envolvem heteroskedasticity (que ocorre frequentemente em modelos usando dados transversais) e autocorrelação (que tende a estar presente em modelos usando dados de séries temporais).

Além de saber o tipo de dados que você está trabalhando com, certifique-se que você está sempre ciente das seguintes informações:

  • O nível de agregação usado para medir as variáveis: O nível de agregação refere-se à unidade de análise quando a informação é adquirida para os dados. Em outras palavras, as medidas variáveis ​​podem ter origem em um nível mais baixo de agregação (como um indivíduo, família ou empresa) ou a um nível superior de agregação (como uma cidade, município ou estado).

  • o freqüência com a qual os dados são capturados: A frequência refere-se à taxa à qual as medições são obtidas. dados de séries temporais podem ser capturados em uma freqüência maior (como por hora, diária ou semanal) ou com menor frequência (como mensal, trimestral ou anual).

Todos os dados em todo o mundo não permitirá que você para produzir resultados convincentes, se o nível de agregação ou a frequência não é apropriado para o seu problema. Por exemplo, se você estiver interessado na determinação de como os gastos por aluno afeta o desempenho acadêmico, os dados a nível de Estado provavelmente não será apropriado porque os gastos e as características dos alunos têm tanta variação entre as cidades no interior dos Estados que seus resultados são susceptíveis de induzir em erro.

Evitar a armadilha de mineração de dados

Como você adquirir mais ferramentas de análise de dados, você pode estar inclinado a pesquisar os dados de relações entre as variáveis. Você pode usar seu conhecimento das estatísticas de encontrar modelos que se encaixam os seus dados muito bem. No entanto, esta prática é conhecida como mineração de dados, e você não quer ser seduzido por ela!

Embora a mineração de dados pode ser útil em campos onde o mecanismo subjacente a gerar os resultados não é importante, a maioria dos economistas não vêem essa abordagem favorável. Em econometria, a construção de um modelo que faz sentido e é reproduzível por outros é muito mais importante do que procurar um modelo que tem um ajuste perfeito.

Incorporando informações quantitativas e qualitativas

os resultados económicos pode ser afetada por fatores quantitativos (numéricos) e qualitativos (não-numéricos). Geralmente, a informação quantitativa tem uma aplicação direta e interpretação em modelos econométricos.

As variáveis ​​qualitativas são associados com características que não têm representação numérica natural, embora seus dados brutos pode codificar características qualitativas com um valor numérico. Por exemplo, uma região EUA pode ser codificado com um 1 para o Oeste, 2 para Sul, 3 para a Centro-Oeste, e 4 para Nordeste. No entanto, a atribuição de valores específicos é arbitrária e não carrega nenhum significado especial.

A fim de utilizar as informações contidas nas variáveis ​​qualitativas, normalmente você vai convertê-los em variáveis ​​fictícias - variáveis ​​dicotômicas que assumem um valor de 1 se uma característica particular está presente e 0 caso contrário.

Às vezes, o próprio resultado econômico é qualitativa ou contém valores restritos. Por exemplo, a variável dependente pode medir se ou não uma empresa falhar (vai à falência) em um determinado ano usando várias características das empresas como variáveis ​​independentes. Embora as técnicas convencionais são, por vezes aceitável com variáveis ​​dependentes qualitativas e não contínuas, geralmente resultam em violação de pressuposições e exigem uma abordagem econométrica alternativa.

menu