Como encontrar diferenças médias usando uma variável dummy
Você deve se lembrar de seu curso de estatística como conduzir o t
-teste para examinar as diferenças de médias entre dois grupos. Mas o que você pode não saber é que você pode usar variáveis binárias e análise de regressão para obter os mesmos resultados que a t-teste.Especificação
Mesmo que o seu modelo econométrico é provável que incluem características quantitativas e qualitativas, você pode começar com um modelo que utiliza apenas uma variável dummy para capturar características qualitativas e ignora outras variáveis independentes potenciais. Este processo corresponde a identificação de diferenças de médias para os grupos identificados pela variável dummy (s), mas é um bloco de construção útil para a compreensão de modelos mais realistas que combinam características qualitativas com variáveis quantitativas.
Se a característica qualitativa que você gostaria de usar como uma variável independente contém apenas dois grupos, em seguida, um modelo econométrico com uma única variável dummy como a única variável explicativa podem ser expressos como

Onde Y é a variável dependente,

é a intercepção (ou constante) prazo e

é o impacto da característica representada pela variável dummy (D). DEu = 1 se a característica qualitativa específico está presente e DEu = 0 se não.
Se a característica qualitativa que você gostaria de usar como uma variável independente tem mais do que dois grupos, em seguida, o modelo econométrico deve incluir J - 1 variáveis para captar plenamente as possibilidades. Suponha que você gostaria de usar uma variável com uma característica qualitativa contendo quatro possíveis resultados {A, B, C e D}. O modelo de base econométrica para capturar uma característica qualitativa é expressa como

Onde DiB = 1 se a observação pertence ao grupo B, DiC = 1 se a observação pertence ao grupo C, Didentidade = 1 se a observação pertence ao grupo D, e DiB = DiC = Didentidade = 0 se a observação está no grupo A. Ao usar esta equação, você atribui implicitamente grupo A como referência ou grupo de base em qualquer comparação de dois grupos.
Interpretação
Uma forma útil de ver o papel de uma variável dummy em um modelo econométrico é interpretar os resultados de uma regressão usando uma variável fictícia como a única variável independente.
Uma regressão estimada com uma variável dummy é geralmente escrito como

onde o

termos representam os parâmetros estimados. Porque D só pode ser 0 ou 1, para uma dada observação,

o previsto Y valor a partir de uma regressão representa a estimativa da média condicional (E(Y | DEu)). A variável dummy tem apenas dois valores, de modo a obter dois previu Y valores. Portanto, o predito Y os valores são iguais aos meios de amostra para cada grupo.