Como configurar a função de População Regressão (PRF) Modelo

Antes de começar com a análise de regressão, é necessário identificar o regre populaçãosfunção sion (PRF). A PRF define a realidade (ou sua percepção dela) no que se refere ao seu tópico de interesse. Para identificá-lo, você precisa determinar suas variáveis ​​dependentes e independentes (e como eles vão ser medido), bem como a função matemática que descreve como as variáveis ​​estão relacionadas.

Depois de afinar a sua tópico ou questão de interesse, você está pronto para desenvolver o seu modelo usando as seguintes etapas:

  1. Fornecer a especificação geral matemática do seu modelo.

    A especificação geral denota a variável dependente e todas as variáveis ​​independentes (ou explicativas) que você acredita que afetam a variável dependente em sua população de interesse.

    Suponha que três variáveis ​​afetam a variável dependente. A especificação geral será algo parecido Y = f(x1,x2,x3), Onde Y é a variável dependente eo xs representam as variáveis ​​independentes, que você acredita que afetam diretamente (ou provocar) flutuações no Y variável.

    A menos que o raciocínio é óbvio, fornecer alguma justificação para as variáveis ​​escolhidas como variáveis ​​independentes e para a forma funcional da especificação (ver Passo 2). Fazer isso ajuda a evitar a má especificação, o que ocorre se você omitir variáveis ​​importantes ou incluir variáveis ​​irrelevantes.

  2. Derivar a especificação econométrica do seu modelo.

    Nesta etapa, você toma as variáveis ​​identificadas na Etapa 1 e desenvolver uma função que pode ser utilizada para calcular os resultados econométricos. Esta forma funcional é conhecido como o populumaregre çãosfunção sion (PRF). Nesta etapa, você também está reconhecendo que o relacionamento que você hipótese no Passo 1 é esperado para existir quando você olha para a média da data- não para cada observação.

    Suponha que você tem razão para acreditar que o modelo é linear. Ele será parecido com este:

    image0.jpg

    Nesta função, o operador de média condicional E(Y|x1,x2,x3) Indica que a relação é esperado para segurar, em média, para valores dados de variáveis ​​independentes. O termo intercepção

    image1.jpg

    também chamado constante, é o valor médio de espera Y quando todos xs são iguais a zero. Os outros betas representam as pistas parciais (efeitos). Estas pistas parciais dizer o quanto as alterações da variável dependente quando você alterar a variável independente em uma unidade, mas manter o valor das outras variáveis ​​independentes constantes.

    (Esta idéia de mudar uma coisa e mantendo o resto da mesma é a ceteris paribus, ou tudo o mais igual, desde que você está familiarizado com a partir de seus cursos de introdução à economia.)

    Dependendo do fenômeno particular que está a analisar, uma relação não linear, utilizando quadrado termos, troncos, ou outro método em vez da função linear

    image2.jpg

    pode ser mais apropriado.

    A especificação que você escolher é assumido para descrever o # 147-true # 148- relacionamento, por isso não deixe para justificá-la usando a teoria econômica de som e bom senso.

  3. Especificar a natureza aleatória do seu modelo.

    Esta etapa esclarece que a relação que você tenha assumido nas Etapas 1 e 2 contém, em média, mas pode conter erros quando uma observação específica é escolhido aleatoriamente da população. Isto é conhecido como o função de regressão populacional estocástico e é como escrito

    image3.jpg

    onde o Eu subscritos designar qualquer observação escolhido aleatoriamente e

    image4.jpg

    representa o estocástico (ou aleatória) termo de erro associado a essa observação. Observe que stochastique é simplesmente estatísticas jargão para aleatória.

    Independentemente de como você escolher para representar a PRF, o termo de erro aleatório representa a diferença entre o valor observado da variável dependente e a média condicional da variável dependente derivado de seu modelo. Este valor é positivo se o valor observado está acima da média condicional e negativo se estiver abaixo.

O erro aleatório pode ser resultado de um ou mais dos seguintes factores:

  • Dados insuficientes ou medidos incorretamente

  • A falta de conhecimentos teóricos para terem plenamente em conta todos os fatores que afetam a variável dependente

  • Aplicando um form- funcional incorreta por exemplo, supondo que a relação é linear quando é quadrática

  • características não observáveis

  • elementos imprevisíveis de comportamento

Se você tem várias variáveis ​​explicativas, você pode economizar tempo escrevendo o modelo econométrico usando algum abreviação matemática. Com a notação algébrica, que seria parecido com uma das duas funções a seguir:

image5.jpg

menu