Como estimar a diferença entre duas proporções

Para estimar a diferença entre duas proporções da população com um intervalo de confiança, você pode usar o Teorema do Limite Central quando os tamanhos de amostra são grandes o suficiente (tipicamente, cada um, pelo menos, 30). Quando uma característica estatístico, tal como a opinião sobre uma questão (apoio / não suportam), um dos dois grupos que estão sendo comparados é categórico, as pessoas querem um relatório sobre as diferenças entre as duas proporções da população - por exemplo, a diferença entre a proporção de mulheres e homens que apoiam uma semana de trabalho de quatro dias. Como você faz isso?

Você estimar a diferença entre duas proporções populacionais, p1 - p2, tomando uma amostra a partir de cada população e utilizando a diferença das duas proporções de amostra,

image0.png

mais ou menos uma margem de erro. O resultado é uma chamada intervalo de confiança para a diferença de duas proporções populacionais, p1 - p2.

A fórmula para um intervalo de confiança (IC) para a diferença entre duas proporções da população é

image1.png

e n1 são o tamanho proporção da amostra e da amostra da primeira amostra, e

image2.png

e n2 são a proporção da amostra eo tamanho da amostra da segunda amostra. O valor que Z * é o valor adequado a partir da distribuição normal padrão para o seu nível de confiança desejado. (Consulte a tabela a seguir para Z *-valores).

z*-Os valores para os vários níveis de confiança
Nível de confiançaz * -valor
80%1,28
90%1.645 (por convenção)
95%1,96
98%2.33
99%2.58

Para calcular uma CI para a diferença entre duas proporções populacionais, faça o seguinte:

  1. Determinar o nível de confiança e encontrar a apropriada Z *-valor.

    Consulte tothe tabela acima.

  2. Encontrar a proporção da amostra

    image3.png

    para a primeira amostra, tendo o número total da primeira amostra que estão na categoria de interesse e dividindo pelo tamanho da amostra, n1. Da mesma forma, encontrar

    image4.png

    para a segunda amostra.

  3. Aqui a diferença entre as proporções de amostra,

    image5.png
  4. Encontrar

    image6.png

    e dividir por n1. Encontrar

    image7.png

    e dividir por n2. Adicione estes dois resultados juntos e tirar a raiz quadrada.

  5. Multiplicar Z * vezes o resultado do passo 4.

    Este passo dá-lhe a margem de erro.

  6. Levar

    image8.png

    mais ou menos a margem de erro a partir do Passo 5, para obter a IC.

    A extremidade inferior da CI é

    image9.png

    menos a margem de erro, ea extremidade superior da CI é

    image10.png

    mais a margem de erro.

A fórmula apresentada aqui por um CI para p1 - p2é usada sob a condição de que ambos os tamanhos de amostra são grandes o suficiente para o Teorema do Limite Central a aplicar e permitem que você use um z* -value- Isso é verdade quando você está estimando proporções utilizando inquéritos de grande escala, por exemplo. Para amostras de pequenas dimensões, intervalos de confiança estão fora do âmbito de um curso de estatísticas de introdução.

Suponha que você trabalha para o Las Vegas Chamber of Commerce, e que pretende estimar com 95% de confiança da diferença entre a percentagem de todas as mulheres que já passaram para ver um imitador de Elvis ea percentagem de todos os homens que já passaram a ver uma Elvis imitador, a fim de ajudar a determinar como você deve comercializar suas ofertas de entretenimento.

  1. Porque você quer um intervalo de confiança de 95%, o seu Z *-valor é 1.96.

  2. Suponha que a sua amostra aleatória de 100 mulheres inclui 53 mulheres que viram um imitador de Elvis, por isso,

    image11.png

    é 53 dividido por 100 = 0,53. Suponha também que a sua amostra aleatória de 110 homens inclui 37 homens que já vi um imitador de Elvis, por isso,

    image12.png

    é 37 dividido por 110 = 0,34.

  3. A diferença entre essas proporções amostrais (fêmeas - do sexo masculino) é 0,53-0,34 = 0,19.

  4. tome 0,53 # 8727- (1 - 0,53) para se obter 0,2941. Em seguida, dividir por 100 para obter 0,0025. Em seguida, tomar 0,34 # 8727- (1 - 0,34) para se obter 0,2244. Em seguida, dividir por 110 para obter 0,0020. Adicione estes dois resultados para obter 0,0025 + 0,0020 = 0,0045. Em seguida, encontrar a raiz quadrada de 0,0045, que é 0,0671.

  5. 1,96 # 8727- 0,0671 dá-lhe 0,13, ou 13%, que é a margem de erro.

  6. O seu intervalo de confiança de 95% para a diferença entre a percentagem de mulheres que têm visto um imitador de Elvis e a percentagem de homens que têm visto um imitador de Elvis é de 0,19 ou 19% (o que você tem na Etapa 3), mais ou menos 13%. A extremidade inferior do intervalo é de 0,19 - 0,13 = 0,06% ou 6 - extremidade superior é de 0,19 + 0,13 = 0,32 ou 32%.

    Para interpretar esses resultados dentro do contexto do problema, você pode dizer com 95% de confiança de que um percentual maior de mulheres do que homens têm visto um imitador de Elvis, e a diferença de estas percentagens está em algum lugar entre 6% e 32%, com base no seu amostra.

    A tentação é dizer, # 147 Bem, eu sabia que uma maior proporção de mulheres tem visto um imitador de Elvis porque essa proporção da amostra foi de 0,53 e para os homens foi apenas 0,34. Por que eu ainda preciso de um intervalo de confiança? # 148- Todos esses dois números lhe dizer algo sobre essas 210 pessoas amostradas. Você também precisa levar em consideração a variação usando a margem de erro para ser capaz de dizer algo sobre toda a população de homens e mulheres.

Claro, há alguns caras lá fora, que não admitem que já tinha visto um imitador de Elvis (embora eles provavelmente fingiu ser um fazendo karaoke em algum ponto). Isso pode criar algum viés nos resultados.

Observe que você pode obter um valor negativo para

image13.png

Por exemplo, se você tinha mudado os machos e fêmeas, você teria chegado -0,19 para esta diferença. Tudo bem, mas você pode evitar diferenças negativas nas proporções de amostras por ter o grupo com a maior proporção de exemplo servir como o primeiro grupo (aqui, do sexo feminino).

No entanto, mesmo se o grupo com a maior proporção de amostra serve como o primeiro grupo, às vezes você ainda obter valores negativos no intervalo de confiança. Suponha que no exemplo acima que apenas 0,43 das mulheres tinha visto um imitador de Elvis. Assim, a diferença na proporção é de 0,09, e a extremidade superior do intervalo de confiança é de 0,09 + 0,13 = 0,22, enquanto a extremidade inferior é 0,09-0,13 = -0,04. Isto significa que a verdadeira diferença é razoavelmente em qualquer lugar de 22% mais mulheres a 4% mais homens. É muito perto de dizer com certeza.

menu