Como interpretar um gráfico de dispersão

Scatterplots são úteis para interpretar as tendências em dados estatísticos. Cada observação (ou ponto) em um gráfico de dispersão tem dois coordinates- o primeiro corresponde à primeira parte de dados no par (que é o x coordinate- a quantidade que você vá para a esquerda ou para a direita). A segunda coordenada corresponde à segunda parte dos dados do par (que é o Y-coordinate- a quantidade que você ir para cima ou para baixo). O ponto que representa que a observação é colocada na intersecção das duas coordenadas.

Dispersão da temperatura exterior em relação ao silvos de críquete.
Dispersão da temperatura exterior em relação ao silvos de críquete.

A figura acima mostra um gráfico de dispersão para a temperatura e grilos dados listados na tabela a seguir.

Dados de temperatura e grilos (extracto)
Temperatura (Fahrenheit)Número de Chirps (em 15 segundos)
5718
6020
6421
6523
6827
7130
7434
7739

Como os dados são ordenadas de acordo com os seus x-valores, os pontos no gráfico de dispersão de correspondência a partir da esquerda para a direita com as observações apresentadas na tabela, na ordem listada.

Você interpreta um conjunto disperso por olhar para as tendências nos dados que você vá da esquerda para a direita:

  • Se os dados mostram um padrão de subida como você se move da esquerda para a direita, isto indica uma relação positiva entre X e Y. à medida que o X-valoriza aumento (mover para a direita), o Y-valores tendem a aumentar (mover para cima).

  • Se os dados mostram um padrão downhill como você se move da esquerda para a direita, isto indica uma relação negativa entre X e Y. à medida que o x-valuesincrease (mover para a direita), o Y-valores tendem a diminuir (mover para baixo).

  • Se os dados não parece assemelhar-se a qualquer tipo de padrão (mesmo um vago), então não existe nenhuma relação entre x e Y.

Um padrão de especial interesse é um linear teste padrão, onde os dados tem uma aparência geral de uma linha que vai subidas ou descidas. Olhando para a figura anterior, você pode ver que uma relação linear positiva parece entre a temperatura eo número de silvos de críquete. Isto é, quando a temperatura aumenta, o número de grilos aumenta também. Note-se que o diagrama de dispersão apenas sugere uma relação linear entre os dois conjuntos de valores. ele faz não sugerem que um aumento na temperatura causas o número de grilos a aumentar.

UMA relação linear entre X e Y existe quando o padrão de x- e Y-valores se assemelha a uma linha, quer a subir (com uma inclinação positiva) ou em declive (com uma inclinação negativa).

Scatterplots mostrar possíveis associações ou relações entre duas variáveis. No entanto, só porque o seu gráfico ou tabela mostra algo está acontecendo, isso não significa que existe uma relação de causa e efeito.

Por exemplo, um médico observa que as pessoas que tomam vitamina C todos os dias parecem ter menos resfriados. Será que isso significa vitamina C previne resfriados? Não necessariamente. Pode ser que as pessoas que estão mais conscientes da saúde tomar vitamina C todos os dias, mas eles também comem mais saudável, não está acima do peso, exercer todos os dias, e lavar as mãos com mais frequência. Se este médico realmente quer saber se é a vitamina C que está fazendo isso, ela precisa de um experimento bem concebido que exclui estes outros fatores.

menu