Histogramas: técnica gráfica de dados estatísticos

UMA histograma é um gráfico que representa a distribuição de probabilidade de um conjunto de dados. Um histograma tem uma série de barras verticais, onde cada barra representa um único valor ou uma gama de valores de uma variável. As alturas das barras indicam as frequências ou probabilidades para os diferentes valores ou intervalos de valores.

Por exemplo, esta figura mostra um histograma dos preços diários das ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

Histograma de preços diárias para as ações da Apple.
Histograma de preços diárias para as ações da Apple.

De acordo com este histograma, a maioria dos preços foram entre US $ 60 e US $ 65 o preço era nesta faixa de 81 vezes durante o ano. Os segundos preços mais frequentemente observadas foram entre US $ 55 e US $ 60 o preço desembarcou nesta faixa de 44 vezes durante o ano. A terceira faixa mais freqüente de preços foi entre US $ 65 e US $ 70, ea quarta faixa mais freqüente de preços foi entre $ 70 e $ 75. Muito poucas preços foram entre US $ 50 e US $ 55, eo menor número de preços observados durante o ano foram entre US $ 80 e US $ 85.

Com base no gráfico, a média e preço médio estavam perto da faixa de US $ 60 a US $ 65. A média real foi de US $ 65,67, ea mediana real foi de US $ 63,65. Uma vez que a média excede a mediana, a distribuição de preços para 2013 foi positivamente inclinada. Isto indica que a probabilidade de um preço extremamente grande é um pouco maior do que a probabilidade de um preço extremamente baixo.

Uma distribuição é positivamente enviesada se a média é maior do que o median- é negativamente inclinada se a média é menor do que a mediana. A distribuição é simétrica em torno da média se a média igual a mediana. Quanto os dados são distorcidos depende de quão longe a média ea mediana diferentes. Se eles estão muito perto, às vezes é prático para tratar a distribuição como simétrica.

Como outro exemplo, esta figura mostra um histograma dos preços diários da SP 500 índice de ações de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

Histograma de preços diários para o S & P 500.
Histograma de preços diários para o SP 500.

De acordo com o histograma na Figura 12-10, a gama mais frequentemente observada dos preços durante o ano era entre US $ 1.650 e US $ 1.700. A média acabou por ser de US $ 1,643.80, ea mediana foi de US $ 1,650.41. Ao contrário de ações da Apple, a média foi de abaixo o median- a distribuição de preços para 2013 é inclinada negativamente. Isto indica que houve uma tendência ligeiramente maior para o padrão e pobre do 500 ao comércio abaixo da média do que acima da média em 2013.

Uma das utilizações mais importantes de histogramas é para determinar se um conjunto de dados segue uma distribuição de probabilidade especificada. Embora existam muitos testes estatísticos formais para determinar qual distribuição de probabilidade de um conjunto de dados seguinte, é boa prática para inspecionar visualmente os dados com um gráfico antes de se envolver em quaisquer testes estatísticos formais.

O histograma de preços da Apple fornece fortes evidências de que os preços das ações da Apple são não normalmente distribuídos. A distribuição normal é simétrico sobre sua média, enquanto que os preços das ações da Apple estão positivamente inclinada. O histograma de preços SP fornece fortes evidências de que a SP 500 é também pouco provável a ser distribuída normalmente, porque sua distribuição é enviesada negativamente.

testes estatísticos formais seriam necessários para mostrar que nem a distribuição é normal, mas os gráficos são altamente sugestivos. Porque muitos testes estatísticos são baseados na suposição de normalidade, é importante para determinar se uma distribuição é verdadeiramente normal, antes de usar qualquer um desses testes.

menu