Gráficos de Dispersão: técnica gráfica de dados estatísticos
Ao contrário de um lote caule e folhas, um gráfico de dispersão destina-se a mostrar a relação entre dois variáveis. Pode ser difícil para ver se há uma relação entre duas variáveis só de olhar para os dados brutos, mas com um gráfico de dispersão, quaisquer padrões que existem nos dados tornam-se muito mais fácil de ver.
Um gráfico de dispersão é constituída por uma série de pontos- cada ponto mostra um único valor para duas variáveis diferentes. Por exemplo, você poderia construir um gráfico de dispersão para mostrar a relação entre as receitas anuais da corporação e seus lucros anuais. Se você está tentando prever lucros com base em receita, o eixo X seria usado para mostrar receitas anuais, eo eixo Y seria usado para mostrar lucros anuais. Assim, as receitas são considerados como sendo a variável independente, e os lucros são considerados como sendo a variável dependente nessa relação.
Em um gráfico de dispersão, o eixo dos X (isto é, o eixo horizontal) é usada para mostrar o independente variável, e o eixo Y (o eixo vertical) é usada para mostrar o dependente variável.
Neste exemplo, cada ponto no gráfico de dispersão mostra as receitas e vendas para um determinado ano. A tabela mostra a relação entre as receitas anuais e lucro anual de uma empresa durante os anos de 2004-2014.
Ano | Receitas ($ milhões) | Lucros ($ milhões) |
---|---|---|
2004 | 225 | 42 |
2005 | 237 | 43 |
2006 | 245 | 48 |
2007 | 222 | 40 |
2008 | 265 | 60 |
2009 | 270 | 56 |
2010 | 254 | 53 |
2011 | 280 | 60 |
2012 | 290 | 62 |
2013 | 305 | 65 |
2014 | 312 | 71 |
A figura a seguir mostra o gráfico de dispersão resultante.
Cada ponto no gráfico de dispersão representa as receitas e os lucros relacionados da corporação para um único ano. Por exemplo, o ponto no canto superior direito, canto da trama representa dados para 2014, quando a receita da companhia foi de US $ 312 milhões e os lucros foram de US $ 71 milhões.
Você pode usar um gráfico de dispersão para determinar se
As duas variáveis tendem a mover-se na mesma direcção.
As duas variáveis tendem a mover-se em sentidos opostos.
As duas variáveis não estão relacionados uns com os outros.
Se duas variáveis tendem a mover-se na mesma direcção, eles são referidos como sendo positivamente correlated- Se eles tendem a mover-se em sentidos opostos, que são referidos como sendo negativamente correlacionados. Se duas variáveis não mostram qualquer padrão particular, eles são referidos como sendo não correlacionadas.
Esta figura mostra um gráfico de dispersão de duas variáveis (X e Y) que estão positivamente correlacionados.
O gráfico de dispersão mostra que como X aumenta, há uma forte tendência para Y para aumentar (mas não necessariamente na mesma proporção). Isto mostra que X e Y são positivamente correlacionados.
A figura a seguir mostra o mesmo gráfico de dispersão com uma tendência linha- a equação desta linha é estimado com análise de regressão.
A linha de tendência mostra o quanto as mudanças Y, em média, dada uma mudança específica no X. Uma linha de tendência positivamente inclinada indica que duas variáveis são positivamente correlated- semelhante, uma linha de tendência negativamente inclinada indica que duas variáveis são negativamente correlacionados. Se uma linha de tendência é plana (isto é, tem um declive de zero), isso indica que as duas variáveis são independentes uns dos outros. A linha de tendência positivamente inclinada mostra que X e Y são positivamente correlacionados.
A figura a seguir mostra um gráfico de dispersão ea linha de tendência para duas variáveis que são negativamente correlacionados.
O gráfico de dispersão mostra que o aumento de x, Y tende a decrease- a linha de tendência tem um negativo declive. Portanto, X e Y são negativamente correlacionados.
A figura a seguir mostra um gráfico de dispersão ea linha de tendência para duas variáveis que são não correlacionadas.
O gráfico de dispersão mostra que o aumento de x, Y, por vezes, aumenta e, por vezes, diminui. Não existe um padrão particular, aos dados. Os pontos parecem estar dispersos aleatoriamente ao longo do diagrama. Como resultado, a linha de tendência é quase plana, e isto mostra que X e Y são não correlacionadas.
Para um exemplo do mundo real, esta figura mostra um gráfico de dispersão da relação entre o preço das ações da Apple e do Padrão e índice de mercado de 500 ações da pobre de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
índice 500 (SP 500) da Standard and Poor é uma média dos preços das 500 maiores estoques dos EUA. O valor deste índice reflete o estado geral da economia dos EUA. O gráfico mostra que há uma correlação positiva entre o preço das ações da Apple eo SP 500.