Como configurar a função de População Regressão (PRF) Modelo
Antes de começar com a análise de regressão, é necessário identificar o regre populaçãosfunção sion (PRF). A PRF define a realidade (ou sua percepção dela) no que se refere ao seu tópico de interesse. Para identificá-lo, você precisa determinar suas variáveis dependentes e independentes (e como eles vão ser medido), bem como a função matemática que descreve como as variáveis estão relacionadas.
Depois de afinar a sua tópico ou questão de interesse, você está pronto para desenvolver o seu modelo usando as seguintes etapas:
Fornecer a especificação geral matemática do seu modelo.
A especificação geral denota a variável dependente e todas as variáveis independentes (ou explicativas) que você acredita que afetam a variável dependente em sua população de interesse.
Suponha que três variáveis afetam a variável dependente. A especificação geral será algo parecido Y = f(x1,x2,x3), Onde Y é a variável dependente eo xs representam as variáveis independentes, que você acredita que afetam diretamente (ou provocar) flutuações no Y variável.
A menos que o raciocínio é óbvio, fornecer alguma justificação para as variáveis escolhidas como variáveis independentes e para a forma funcional da especificação (ver Passo 2). Fazer isso ajuda a evitar a má especificação, o que ocorre se você omitir variáveis importantes ou incluir variáveis irrelevantes.
Derivar a especificação econométrica do seu modelo.
Nesta etapa, você toma as variáveis identificadas na Etapa 1 e desenvolver uma função que pode ser utilizada para calcular os resultados econométricos. Esta forma funcional é conhecido como o populumaregre çãosfunção sion (PRF). Nesta etapa, você também está reconhecendo que o relacionamento que você hipótese no Passo 1 é esperado para existir quando você olha para a média da data- não para cada observação.
Suponha que você tem razão para acreditar que o modelo é linear. Ele será parecido com este:
Nesta função, o operador de média condicional E(Y|x1,x2,x3) Indica que a relação é esperado para segurar, em média, para valores dados de variáveis independentes. O termo intercepção
também chamado constante, é o valor médio de espera Y quando todos xs são iguais a zero. Os outros betas representam as pistas parciais (efeitos). Estas pistas parciais dizer o quanto as alterações da variável dependente quando você alterar a variável independente em uma unidade, mas manter o valor das outras variáveis independentes constantes.
(Esta idéia de mudar uma coisa e mantendo o resto da mesma é a ceteris paribus, ou tudo o mais igual, desde que você está familiarizado com a partir de seus cursos de introdução à economia.)
Dependendo do fenômeno particular que está a analisar, uma relação não linear, utilizando quadrado termos, troncos, ou outro método em vez da função linear
pode ser mais apropriado.
A especificação que você escolher é assumido para descrever o # 147-true # 148- relacionamento, por isso não deixe para justificá-la usando a teoria econômica de som e bom senso.
Especificar a natureza aleatória do seu modelo.
Esta etapa esclarece que a relação que você tenha assumido nas Etapas 1 e 2 contém, em média, mas pode conter erros quando uma observação específica é escolhido aleatoriamente da população. Isto é conhecido como o função de regressão populacional estocástico e é como escrito
onde o Eu subscritos designar qualquer observação escolhido aleatoriamente e
representa o estocástico (ou aleatória) termo de erro associado a essa observação. Observe que stochastique é simplesmente estatísticas jargão para aleatória.
Independentemente de como você escolher para representar a PRF, o termo de erro aleatório representa a diferença entre o valor observado da variável dependente e a média condicional da variável dependente derivado de seu modelo. Este valor é positivo se o valor observado está acima da média condicional e negativo se estiver abaixo.
O erro aleatório pode ser resultado de um ou mais dos seguintes factores:
Dados insuficientes ou medidos incorretamente
A falta de conhecimentos teóricos para terem plenamente em conta todos os fatores que afetam a variável dependente
Aplicando um form- funcional incorreta por exemplo, supondo que a relação é linear quando é quadrática
características não observáveis
elementos imprevisíveis de comportamento
Se você tem várias variáveis explicativas, você pode economizar tempo escrevendo o modelo econométrico usando algum abreviação matemática. Com a notação algébrica, que seria parecido com uma das duas funções a seguir: