Como interpretar um gráfico de dispersão
Scatterplots são úteis para interpretar as tendências em dados estatísticos. Cada observação (ou ponto) em um gráfico de dispersão tem dois coordinates- o primeiro corresponde à primeira parte de dados no par (que é o x coordinate- a quantidade que você vá para a esquerda ou para a direita). A segunda coordenada corresponde à segunda parte dos dados do par (que é o Y-coordinate- a quantidade que você ir para cima ou para baixo). O ponto que representa que a observação é colocada na intersecção das duas coordenadas.
A figura acima mostra um gráfico de dispersão para a temperatura e grilos dados listados na tabela a seguir.
Dados de temperatura e grilos (extracto) | |
Temperatura (Fahrenheit) | Número de Chirps (em 15 segundos) |
---|---|
57 | 18 |
60 | 20 |
64 | 21 |
65 | 23 |
68 | 27 |
71 | 30 |
74 | 34 |
77 | 39 |
Como os dados são ordenadas de acordo com os seus x-valores, os pontos no gráfico de dispersão de correspondência a partir da esquerda para a direita com as observações apresentadas na tabela, na ordem listada.
Você interpreta um conjunto disperso por olhar para as tendências nos dados que você vá da esquerda para a direita:
Se os dados mostram um padrão de subida como você se move da esquerda para a direita, isto indica uma relação positiva entre X e Y. à medida que o X-valoriza aumento (mover para a direita), o Y-valores tendem a aumentar (mover para cima).
Se os dados mostram um padrão downhill como você se move da esquerda para a direita, isto indica uma relação negativa entre X e Y. à medida que o x-valuesincrease (mover para a direita), o Y-valores tendem a diminuir (mover para baixo).
Se os dados não parece assemelhar-se a qualquer tipo de padrão (mesmo um vago), então não existe nenhuma relação entre x e Y.
Um padrão de especial interesse é um linear teste padrão, onde os dados tem uma aparência geral de uma linha que vai subidas ou descidas. Olhando para a figura anterior, você pode ver que uma relação linear positiva parece entre a temperatura eo número de silvos de críquete. Isto é, quando a temperatura aumenta, o número de grilos aumenta também. Note-se que o diagrama de dispersão apenas sugere uma relação linear entre os dois conjuntos de valores. ele faz não sugerem que um aumento na temperatura causas o número de grilos a aumentar.
UMA relação linear entre X e Y existe quando o padrão de x- e Y-valores se assemelha a uma linha, quer a subir (com uma inclinação positiva) ou em declive (com uma inclinação negativa).
Scatterplots mostrar possíveis associações ou relações entre duas variáveis. No entanto, só porque o seu gráfico ou tabela mostra algo está acontecendo, isso não significa que existe uma relação de causa e efeito.
Por exemplo, um médico observa que as pessoas que tomam vitamina C todos os dias parecem ter menos resfriados. Será que isso significa vitamina C previne resfriados? Não necessariamente. Pode ser que as pessoas que estão mais conscientes da saúde tomar vitamina C todos os dias, mas eles também comem mais saudável, não está acima do peso, exercer todos os dias, e lavar as mãos com mais frequência. Se este médico realmente quer saber se é a vitamina C que está fazendo isso, ela precisa de um experimento bem concebido que exclui estes outros fatores.