Como encontrar a distribuição amostral de uma proporção da amostra
Se você usar um tamanho de amostra estatística grande o suficiente, você pode aplicar o Teorema do Limite Central (CLT) a uma proporção da amostra para dados categóricos para encontrar sua distribuição de amostragem. o proporção populacional, p, é a proporção de indivíduos na população que têm uma certa característica de interesse (por exemplo, a proporção de todos os americanos que são eleitores registrados, ou a proporção de todos os adolescentes que possuem celulares). o proporção da amostra, denotado
(pronunciado p-hat), A proporção de indivíduos na amostra que têm que nomeadamente characteristic- em outras palavras, o número de indivíduos na amostra que têm esta característica de interesse dividida pelo tamanho total da amostra (n).
Por exemplo, se você tirar uma amostra de 100 adolescentes e encontrar 60 deles próprios celulares, a proporção da amostra de adolescentes proprietárias de celulares é
A distribuição de amostragem de
tem as seguintes propriedades:
A sua média, denotada por
(pronunciado mu sub-p-hat), A proporção é igual a população, p.
Seu erro padrão, denotada por
(dizer sigma sub-p-hat), é igual a:
(Observe que, como n está no denominador, o erro padrão como diminui n aumenta.)
Devido à CLT, a sua forma é aproximadamente normal, desde que a dimensão da amostra é suficientemente grande. Portanto, você pode usar a distribuição normal encontrar probabilidades aproximadas para
O maior tamanho da amostra (n) Ou o mais perto p é de 0,50, o mais estreita a distribuição de amostra é a proporção de uma distribuição normal.
Se você está interessado no número (mais do que a proporção) dos indivíduos na sua amostra com a característica de interesse, você usa a distribuição binomial para encontrar probabilidades para os resultados.
Quão grande é grande o suficiente para a CLT para trabalhar para proporções amostrais? A maioria dos estatísticos concordam que tanto np e n(1 - p) Deve ser maior do que ou igual a 10. Isto é, o número médio de sucessos (np) E o número médio de falhas n(1 - p) Deve ser de pelo menos 10.
Para ajudar a ilustrar a distribuição amostral da proporção da amostra, considere uma pesquisa de estudante que acompanha o teste ACT cada ano perguntando se o aluno gostaria de alguma ajuda com habilidades matemáticas. Suponha (através de pesquisas anteriores) que 38% de todos os alunos tomando a responder ACT sim. Que significa P, a proporção da população, é igual a 0,38 neste caso. A distribuição de respostas (sim, não) para esta população são mostrados na figura acima como um gráfico de barras.
Porque 38% aplica-se a todos os estudantes de fazer o exame, você pode usar p para indicar a proporção da população, em vez de
que indica a proporção da amostra. Tipicamente p é desconhecida, mas este exemplo dá-lhe um valor de apontar como as proporções de amostra a partir de amostras colhidas a partir da população comportar em relação à proporção da população.
Agora pegue todas as amostras possíveis de n = 1.000 estudantes de essa população e encontrar a proporção em cada amostra que disse que eles precisam de matemática ajuda. A distribuição destas proporções de amostra é mostrado na figura acima. Tem uma aproximado distribuição normal com média p = 0,38 e o desvio padrão igual a:
(Ou cerca de 1,5%).
o aproximado distribuição normal funciona porque estão preenchidas as duas condições para a CLT:
E porque n é tão grande (1000), a aproximação é excelente.