Gráficos de Dispersão: técnica gráfica de dados estatísticos

Ao contrário de um lote caule e folhas, um gráfico de dispersão destina-se a mostrar a relação entre dois variáveis. Pode ser difícil para ver se há uma relação entre duas variáveis ​​só de olhar para os dados brutos, mas com um gráfico de dispersão, quaisquer padrões que existem nos dados tornam-se muito mais fácil de ver.

Um gráfico de dispersão é constituída por uma série de pontos- cada ponto mostra um único valor para duas variáveis ​​diferentes. Por exemplo, você poderia construir um gráfico de dispersão para mostrar a relação entre as receitas anuais da corporação e seus lucros anuais. Se você está tentando prever lucros com base em receita, o eixo X seria usado para mostrar receitas anuais, eo eixo Y seria usado para mostrar lucros anuais. Assim, as receitas são considerados como sendo a variável independente, e os lucros são considerados como sendo a variável dependente nessa relação.

Em um gráfico de dispersão, o eixo dos X (isto é, o eixo horizontal) é usada para mostrar o independente variável, e o eixo Y (o eixo vertical) é usada para mostrar o dependente variável.

Neste exemplo, cada ponto no gráfico de dispersão mostra as receitas e vendas para um determinado ano. A tabela mostra a relação entre as receitas anuais e lucro anual de uma empresa durante os anos de 2004-2014.

As receitas anuais e lucros 2004-2014
AnoReceitas ($ milhões)Lucros ($ milhões)
200422542
200523743
200624548
200722240
200826560
200927056
201025453
201128060
201229062
201330565
201431271

A figura a seguir mostra o gráfico de dispersão resultante.

gráfico de dispersão de receitas e lucros anuais 2004-2014.
gráfico de dispersão de receitas e lucros anuais 2004-2014.

Cada ponto no gráfico de dispersão representa as receitas e os lucros relacionados da corporação para um único ano. Por exemplo, o ponto no canto superior direito, canto da trama representa dados para 2014, quando a receita da companhia foi de US $ 312 milhões e os lucros foram de US $ 71 milhões.

Você pode usar um gráfico de dispersão para determinar se

  • As duas variáveis ​​tendem a mover-se na mesma direcção.

  • As duas variáveis ​​tendem a mover-se em sentidos opostos.

  • As duas variáveis ​​não estão relacionados uns com os outros.

Se duas variáveis ​​tendem a mover-se na mesma direcção, eles são referidos como sendo positivamente correlated- Se eles tendem a mover-se em sentidos opostos, que são referidos como sendo negativamente correlacionados. Se duas variáveis ​​não mostram qualquer padrão particular, eles são referidos como sendo não correlacionadas.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​(X e Y) que estão positivamente correlacionados.

gráfico de dispersão de duas variáveis ​​positivamente correlacionados.
gráfico de dispersão de duas variáveis ​​positivamente correlacionados.

O gráfico de dispersão mostra que como X aumenta, há uma forte tendência para Y para aumentar (mas não necessariamente na mesma proporção). Isto mostra que X e Y são positivamente correlacionados.

A figura a seguir mostra o mesmo gráfico de dispersão com uma tendência linha- a equação desta linha é estimado com análise de regressão.

gráfico de dispersão de duas variáveis ​​positivamente correlacionada com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​positivamente correlacionada com uma linha de tendência.

A linha de tendência mostra o quanto as mudanças Y, em média, dada uma mudança específica no X. Uma linha de tendência positivamente inclinada indica que duas variáveis ​​são positivamente correlated- semelhante, uma linha de tendência negativamente inclinada indica que duas variáveis ​​são negativamente correlacionados. Se uma linha de tendência é plana (isto é, tem um declive de zero), isso indica que as duas variáveis ​​são independentes uns dos outros. A linha de tendência positivamente inclinada mostra que X e Y são positivamente correlacionados.

A figura a seguir mostra um gráfico de dispersão ea linha de tendência para duas variáveis ​​que são negativamente correlacionados.

gráfico de dispersão de duas variáveis ​​correlacionadas negativamente com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​correlacionadas negativamente com uma linha de tendência.

O gráfico de dispersão mostra que o aumento de x, Y tende a decrease- a linha de tendência tem um negativo declive. Portanto, X e Y são negativamente correlacionados.

A figura a seguir mostra um gráfico de dispersão ea linha de tendência para duas variáveis ​​que são não correlacionadas.

gráfico de dispersão de duas variáveis ​​não correlacionadas com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​não correlacionadas com uma linha de tendência.

O gráfico de dispersão mostra que o aumento de x, Y, por vezes, aumenta e, por vezes, diminui. Não existe um padrão particular, aos dados. Os pontos parecem estar dispersos aleatoriamente ao longo do diagrama. Como resultado, a linha de tendência é quase plana, e isto mostra que X e Y são não correlacionadas.

Para um exemplo do mundo real, esta figura mostra um gráfico de dispersão da relação entre o preço das ações da Apple e do Padrão e índice de mercado de 500 ações da pobre de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

gráfico de dispersão dos preços diários das ações da Apple eo S & P 500.
gráfico de dispersão dos preços diários das ações da Apple e da SP 500.

índice 500 (SP 500) da Standard and Poor é uma média dos preços das 500 maiores estoques dos EUA. O valor deste índice reflete o estado geral da economia dos EUA. O gráfico mostra que há uma correlação positiva entre o preço das ações da Apple eo SP 500.

menu