Quantificar informação qualitativa para modelos econométricos

Estimar um modelo econométrico exige que toda a informação ser quantificado. Em outras palavras, os números devem ser usados ​​para caracterizar ambas as variáveis ​​quantitativas e qualitativas. As variáveis ​​quantitativas são normalmente codificados com valores numéricos nos dados brutos, mas variáveis ​​qualitativas são susceptíveis de exigir que você execute alguma manipulação quantificação. Aqui, você descobrir como para quantificar as variáveis ​​quando se trabalha com dois grupos, ou com vários grupos.

Definindo uma variável dummy quando você tem apenas duas características possíveis

Em muitos casos, as características qualitativas que deseja incluir em sua análise econométrica tem dois grupos (ou categorias). Em geral, você tem dois grupos quando as observações da amostra têm um "isto" ou "aquilo" opção. Por exemplo, na maioria das pesquisas, o sexo é classificado como macho ou fêmea.

Se uma característica qualitativa tem dois grupos, você precisa criar um dummy a fim de capturar quantitativamente esse atributo. A variável assume o valor de 1 se uma das duas características está presente e 0 se a outra característica é observada. O grupo que é identificado (ou atribuído) 0 valores para a variável dummy criado é chamado de refercia ou grupo de base.

A tabela ilustra como você pode criar uma variável dummy a partir dos dados originais. Coluna 1 contém o título do filme, e Coluna 2 contém o nome do ator principal. Coluna 3 não faz parte dos dados originais, mas você pode criar a variável Fêmea utilizando as informações da coluna 2.

a variável Fêmea é uma variável dummy igual a 1 se o ator principal é do sexo feminino e igual a 0 se o ator principal é do sexo masculino. Note-se que apenas uma variável binária é necessária para capturar duas possibilidades (neste caso, do sexo masculino e do sexo feminino).

Representando Sexo Ator com um dummy
1 Título2 Chumbo3 Feminino
À prova de fogoKirk Cameron0
TransamericaFelicity Huffman1
O lutadorMickey Rourke0
Akeelah and the BeeKeke Palmer1
O Último Rei da EscóciaJames McAvoy0

Fonte: IMDb

Os seus resultados econométricos não são afetados pela qual grupo você decidir atribuir um 1 e qual grupo você atribui um 0 na variável de manequim.

Malabarismo várias características com variáveis ​​binárias

Em alguns casos, as características qualitativas que deseja incluir em sua análise econométrica ter mais do que dois grupos (ou categorias). Em geral, você trabalha com vários grupos quando as observações da amostra são classificados em uma das muitas possibilidades. Por exemplo, uma empresa pode estar localizado na região Oeste, Centro-Oeste, Sul, ou Nordeste do país.

A fim de captar quantitativamente um atributo qualitativa com numerosos grupos (ou possibilidades), você precisa criar variáveis ​​dummy para cada minus grupo 1. A variável assume o valor de 1 se uma característica particular está presente e 0 caso contrário.

Em outras palavras, se você tiver J grupos, você precisa J - 1 variáveis ​​binárias com 1s e 0s para capturar toda a informação qualitativa. O grupo que não tem uma variável dummy é identificado quando todos os outros valores fictícios são 0, e é chamado de sua referência ou grupo base.

Com esses dados, você pode criar as variáveis ​​dummy que você precisa de uma variável qualitativa com vários grupos. Coluna 1 contém o título do filme, e Coluna 2 contém a classificação MPAA (G, PG, PG13, ou R). As colunas 3, 4 e 5 não fazem parte dos dados originais, mas você pode criá-los usando as informações de classificação MPAA na coluna 2.

Observe que o número de variáveis ​​dummy que você precisa é um a menos (três) do que o número de resultados possíveis para a característica qualitativa (neste caso, quatro: G, PG, PG13, e R).

Representando Classificações MPAA com variáveis ​​binárias
1 Título2 MPAA Rating3 PG4 PG135R
À prova de fogoPG100
TransamericaR001
O visitantePG13010
BatidaR001
Herbie: Fully LoadedG000

Fonte: IMDb

O grupo você optar por atribuir um todo o caminho 0 em frente não afecta os seus resultados econométricos. Essas observações (neste exemplo, filmes como G-avaliado Herbie: Fully Loaded) São importantes para incluir e afetam os resultados globais, porque eles são todos parte do grupo de referência. Não importa, no entanto, que tipo de filme é escolhido para ser o grupo de referência.

menu