Como calcular Parâmetros e Estimators
Em econometria, quando você recolher uma amostra aleatória de dados e calcular uma estatística com esses dados, você está produzindo um estimativa pontual, que é uma previsão de um parâmetro da população.
Estatísticas descritivas são medidas que podem ser usados para resumir seus dados de amostra e, posteriormente, fazer previsões sobre a sua população de interesse. Quando medidas descritivas são calculados usando dados da população, esses valores são chamados pumatros. Ao calcular medidas descritivas usando dados de amostra, os valores são chamados estimumatores (ou estatística).
Você poderia estimar vários parâmetros populacionais com dados de amostra, mas aqui você calcular as estatísticas mais populares: média, variância, desvio padrão, covariância e correlação. A lista a seguir indica como cada parâmetro e seu estimador correspondente é calculado.
A média (média): o significar é a média simples da variável aleatória, X. A média da população para x é
Onde xEu representa as medições individuais e N é o tamanho da população. A média da amostra é
A diferença entre a amostra ea média da população é que que a média da amostra usa o tamanho da amostra n em vez de o tamanho da população N.
variância: o variação é a média das diferenças quadradas da média. A variância da população para uma variável aleatória x é
Onde xEu representa as medições individuais,
é a média da população, e N é o tamanho da população. A variância da amostra é
Note-se que o denominador para a variância da amostra não só usa o tamanho da amostra n mas também subtrai 1 a partir desse número. Esta mudança é conhecido como um graus de liberdade ajustamento. Graus de liberdade ajustes são geralmente importante em provar que estimadores são imparciais.
Desvio padrão: o desvio padrão medidas como se espalhar a variável aleatória é, em média, a partir da média. O desvio padrão é a raiz quadrada da variância, de modo que o desvio padrão da população para a variável aleatória x é
eo desvio padrão da amostra é
covariance: o covariância mede quanto duas variáveis aleatórias mudar juntos. A covariância da população entre duas variáveis aleatórias x e Y é
Onde xEu representa o indivíduo x valores, YEu representa o indivíduo Y valores e N é o número total de medições na população. A covariância da amostra é
Onde
é a média da amostra de x,
é a média da amostra de Y, e n é o tamanho da amostra.
Correlação: o correlação refere-se à relação entre duas variáveis aleatórias ou conjuntos de dados. O coeficiente de correlação população entre duas variáveis aleatórias x e Y é
Onde
representa a população de covariância,
é o desvio padrão da população de x, e
é o desvio padrão da população de Y. O coeficiente de correlação da amostra é
Onde sXY é a covariância amostra, sx é o desvio padrão da amostra de x, e sY é o desvio padrão da amostra de Y.
Agora, tente trabalhar com alguns números. A tabela mostra cinco observações de vendas de hambúrguer e preços. Use as fórmulas para calcular a média, variância, desvio padrão, covariância e correlação.
Vendas Hamburger (em unidades), Y | Hamburger preço (em $), X |
---|---|
100 | 1 |
80 | 2 |
63 | 3 |
45 | 4 |
21 | 5 |
Você pode usar o software de computador, como STATA, para calcular a estatística descritiva dos dados. digitando # 147 de soma # 148- na linha de comando, você começa a estatística descritiva para todas as variáveis em seu conjunto de dados. Se você quer a correlação entre duas variáveis, selecione Estatísticas-Sumários, tabelas e testes-Resumo e Estatística Descritiva-correlações e covariâncias na barra de menu.
Ou você pode entrar # 147-corr variable1 variumable2# 148- na linha de comando. Em seu comando, substitua variable1 e variable2 com os nomes reais que você deu as variáveis em seu conjunto de dados. Você pode obter covariância, adicionando uma opção para o tipo de mandamento correlação # 147-corr varEuable1 variable2, cov # 148- na linha de comando.
Você deve verificar se os seus cálculos manuais destas medidas são consistentes com a saída do STATA.
Resumindo de dados com estatísticas descritivas é um procedimento relativamente simples, mas certifique-se de examinar os valores com cuidado. Você pode usar medidas descritivas para garantir que sua amostra contém medidas que são realistas. Por exemplo, se a sua população de interesse é graduados universitários, você não iria esperar a sua amostra aleatória a partir desse grupo têm uma idade média de 21 anos.
muita atenção a esses detalhes fornece mais credibilidade em seus dados e as inferências subsequentes que você faz.