Quantificar informação qualitativa para modelos econométricos
Estimar um modelo econométrico exige que toda a informação ser quantificado. Em outras palavras, os números devem ser usados para caracterizar ambas as variáveis quantitativas e qualitativas. As variáveis quantitativas são normalmente codificados com valores numéricos nos dados brutos, mas variáveis qualitativas são susceptíveis de exigir que você execute alguma manipulação quantificação. Aqui, você descobrir como para quantificar as variáveis quando se trabalha com dois grupos, ou com vários grupos.
Menu
Definindo uma variável dummy quando você tem apenas duas características possíveis
Em muitos casos, as características qualitativas que deseja incluir em sua análise econométrica tem dois grupos (ou categorias). Em geral, você tem dois grupos quando as observações da amostra têm um "isto" ou "aquilo" opção. Por exemplo, na maioria das pesquisas, o sexo é classificado como macho ou fêmea.
Se uma característica qualitativa tem dois grupos, você precisa criar um dummy a fim de capturar quantitativamente esse atributo. A variável assume o valor de 1 se uma das duas características está presente e 0 se a outra característica é observada. O grupo que é identificado (ou atribuído) 0 valores para a variável dummy criado é chamado de refercia ou grupo de base.
A tabela ilustra como você pode criar uma variável dummy a partir dos dados originais. Coluna 1 contém o título do filme, e Coluna 2 contém o nome do ator principal. Coluna 3 não faz parte dos dados originais, mas você pode criar a variável Fêmea utilizando as informações da coluna 2.
a variável Fêmea é uma variável dummy igual a 1 se o ator principal é do sexo feminino e igual a 0 se o ator principal é do sexo masculino. Note-se que apenas uma variável binária é necessária para capturar duas possibilidades (neste caso, do sexo masculino e do sexo feminino).
1 Título | 2 Chumbo | 3 Feminino |
---|---|---|
À prova de fogo | Kirk Cameron | 0 |
Transamerica | Felicity Huffman | 1 |
O lutador | Mickey Rourke | 0 |
Akeelah and the Bee | Keke Palmer | 1 |
O Último Rei da Escócia | James McAvoy | 0 |
Fonte: IMDb
Os seus resultados econométricos não são afetados pela qual grupo você decidir atribuir um 1 e qual grupo você atribui um 0 na variável de manequim.
Malabarismo várias características com variáveis binárias
Em alguns casos, as características qualitativas que deseja incluir em sua análise econométrica ter mais do que dois grupos (ou categorias). Em geral, você trabalha com vários grupos quando as observações da amostra são classificados em uma das muitas possibilidades. Por exemplo, uma empresa pode estar localizado na região Oeste, Centro-Oeste, Sul, ou Nordeste do país.
A fim de captar quantitativamente um atributo qualitativa com numerosos grupos (ou possibilidades), você precisa criar variáveis dummy para cada minus grupo 1. A variável assume o valor de 1 se uma característica particular está presente e 0 caso contrário.
Em outras palavras, se você tiver J grupos, você precisa J - 1 variáveis binárias com 1s e 0s para capturar toda a informação qualitativa. O grupo que não tem uma variável dummy é identificado quando todos os outros valores fictícios são 0, e é chamado de sua referência ou grupo base.
Com esses dados, você pode criar as variáveis dummy que você precisa de uma variável qualitativa com vários grupos. Coluna 1 contém o título do filme, e Coluna 2 contém a classificação MPAA (G, PG, PG13, ou R). As colunas 3, 4 e 5 não fazem parte dos dados originais, mas você pode criá-los usando as informações de classificação MPAA na coluna 2.
Observe que o número de variáveis dummy que você precisa é um a menos (três) do que o número de resultados possíveis para a característica qualitativa (neste caso, quatro: G, PG, PG13, e R).
1 Título | 2 MPAA Rating | 3 PG | 4 PG13 | 5R |
---|---|---|---|---|
À prova de fogo | PG | 1 | 0 | 0 |
Transamerica | R | 0 | 0 | 1 |
O visitante | PG13 | 0 | 1 | 0 |
Batida | R | 0 | 0 | 1 |
Herbie: Fully Loaded | G | 0 | 0 | 0 |
Fonte: IMDb
O grupo você optar por atribuir um todo o caminho 0 em frente não afecta os seus resultados econométricos. Essas observações (neste exemplo, filmes como G-avaliado Herbie: Fully Loaded) São importantes para incluir e afetam os resultados globais, porque eles são todos parte do grupo de referência. Não importa, no entanto, que tipo de filme é escolhido para ser o grupo de referência.