Trabalhando com quadros estatísticos Two-Way

Para explorar as ligações entre as duas variáveis ​​categóricas, primeiro você precisa para organizar os dados que foram coletados, e uma mesa é uma ótima maneira de fazer isso. UMA tabela de duas vias classifica os indivíduos em grupos com base nos resultados, ou distribuições, de duas variáveis ​​categóricas (por exemplo, sexo e opinião).

Suponha que os desenvolvedores da comunidade local estão a construir um acampamento, e eles serão permitidos animais de estimação decididas enquanto eles estão em uma trela. Eles agora estão tentando decidir se o acampamento deve ter uma seção separada para animais de estimação. Você tem um palpite de que os campistas não-animal de estimação na área pode ser mais a favor de uma área de pet separado do que os campistas do animal de estimação, então você decide descobrir o que os membros da comunidade de campismo pensar. Você seleciona aleatoriamente 100 campistas da área local e realizar uma pesquisa pet camping, gravação opinião de cada pessoa em ter uma seção pet (sim, não) e se eles acampamento com animais de estimação (sim, não). Agora você tem uma planilha com 100 linhas de dados, um para cada pessoa que você pesquisou. Cada linha tem dois pedaços de dados: uma coluna para saber se a pessoa é um campista pet (sim, não) e uma coluna para a opinião da pessoa em ter uma seção pet (apoio, se opõem). Suponha que as primeiras 10 linhas de seu conjunto de dados parecido com o que é mostrado na tabela abaixo.

Primeiras 10 linhas de dados do Camping Pesquisa Pet
PessoaCamper animal de estimação?Parecer sobre uma secção separada do animal de estimação
1simOpor
2simOpor
3simApoio
4NãoApoio
5NãoApoio
6simApoio
7NãoOpor
8NãoApoio
9simApoio
10NãoOpor

A partir desta pequena parte de seu conjunto de dados, você pode começar a quebrá-lo sozinho. Por exemplo, olhando para coluna 2 resultados, você vê que metade dos inquiridos (5 dividido por 10 = 0,50) acampamento com animais de estimação e a outra metade não. Daqueles que camp com animais de estimação (isto é, daquelas cinco pessoas que têm um sim na coluna 2), três deles de apoio (60%), com uma seção, os resultados separada e da mesma são verdadeiras para os campistas não-animal de estimação. Estes resultados destes 10 campistas provavelmente não se aplicam a todos os 100 campistas surveyed- no entanto, se você tentou examinar os dados brutos de todas as 100 linhas deste conjunto à mão dados, você não faria muito progresso em ver padrões sem muito trabalho duro.

A fim de obter uma alça sobre o que está acontecendo em um grande conjunto de dados quando você está examinando duas variáveis ​​categóricas, você organizar seus dados em uma tabela de duas vias. Depois de configurar a tabela de duas vias, você pode calcular porcentagens para explorar os dados para responder às suas perguntas de pesquisa. Aqui estão algumas perguntas de interesse a partir dos dados de acampamento acima:

  • Qual a percentagem dos campistas são a favor de uma seção animal de estimação?

  • Qual a percentagem dos campistas são campistas de animais que suportam uma seção animal de estimação?

  • Não uma porcentagem maior de campistas não-pet apoiar uma seção animal de estimação, em comparação com os campistas animal de estimação?

As respostas a estas (e outras) perguntas sobre os dados vêm de encontrar e trabalhar com as proporções ou percentagens, de indivíduos dentro de certas partes da tabela. Este processo envolve o cálculo e examinar o que os estatísticos chamam distribuições. Uma distribuição, no caso de uma tabela de duas vias é uma lista de todos os possíveis resultados para uma variável ou uma combinação de variáveis, juntamente com as suas proporções correspondentes (ou percentagens).

Por exemplo, a distribuição para a variável acampar pet lista as porcentagens de pessoas que fazem e não acampamento com animais de estimação. A distribuição para a combinação da variável pet camping (sim, não) ea variável parecer (apoio, opor) lista as porcentagens de: 1) campistas de animais que suportam um animal de estimação seção- campistas 2) do animal de estimação que se opõem a um animal de estimação seção- 3 ) campistas não-animal de estimação que apoiam uma seção, animal de estimação e 4) os campistas não-animal de estimação que se opõem a uma seção de animal de estimação.

Para qualquer distribuição, todas as percentagens devem somar 100%. Se você estiver usando proporções (decimais), eles devem somar 1,00. Cada indivíduo tem que estar em algum lugar, e ele não pode estar em mais de um lugar ao mesmo tempo. Em alguns casos, o total de todas as proporções podem não ser exactamente 1,00 (ou 100%), devido ao erro de arredondamento. É recomendável que você estender as proporções para 3 ou 4 casas decimais para obter a melhor precisão possível.

A tabela de duas vias que se segue resume os resultados de todos os 100 campistas pesquisados.

Two-Way Tabela de estimação Camping Levantamento de Dados (Todas as 100 linhas)
Apoio Seção Pet separadoSe opõem a Seção Pet separado
pet Camper2010
Non-Pet Camper5515

A tabela tem 2 # 8727- 2 = 4 números na mesma. Estes números representam o células das duas vias mesa- cada uma representa uma intersecção de uma linha e coluna. A célula no canto superior esquerdo da tabela representa as 20 pessoas que estão campistas animal de estimação que suportam uma seção de animal de estimação. Na célula superior direita 10 pessoas são campistas pet opostas uma seção animal de estimação. No canto inferior esquerdo são os 55 campistas não-animal de estimação que querem um animal de estimação seção, as 15 pessoas no canto inferior direito são campistas não-pet opostas uma seção animal de estimação.

menu