Box Plots: técnica gráfica de dados estatísticos

UMA gráfico de caixa é projetado para mostrar várias estatísticas-chave para um conjunto de dados sob a forma de um retângulo ou caixa vertical. As estatísticas mostram que pode incluir o seguinte:

  • valor mínimo

  • Valor máximo

  • Primeiro quartil (Q1)

  • Segundo quartil (Q2)

  • Terceiro quartil (Q3)

  • intervalo interquartil (IQR)

o primeiro quartil de um conjunto de dados é uma medida numérica que divide os dados em duas partes: o menor de 25 por cento das observações e a maior de 75 por cento das observações. Em outras palavras, o primeiro quartil é um valor numérico com as seguintes propriedades:

  • 25 por cento das observações do conjunto de dados são menor que o primeiro quartil.

  • 75 por cento das observações do conjunto de dados são Melhor que o primeiro quartil.

Da mesma forma, o segundo quartil (Também conhecido como o mediana) Divide os dados ao meio, de modo que 50 por cento dos elementos são menores do que a mediana, e 50 por cento são maiores.

o terceiro quartil é o valor para o qual a seguir forem verdadeiras:

  • 75 por cento das observações do conjunto de dados são menor que o terceiro quartil.

  • 25 por cento das observações do conjunto de dados são Melhor que o terceiro quartil.

o intervalo interquartil (IQR) é a diferença entre o terceiro quartil e primeiro quartil: IQR = Q3 - Q1.

O intervalo interquartílico é uma medida de dispersão- que mostra a quantidade de propagação existe entre os elementos na média 50 por cento de um conjunto de dados.

Um gráfico de caixa é desenhada de modo a que

  • A parte superior da caixa representa o terceiro quartil (Q3) Dos dados.

  • A parte inferior da caixa representa o primeiro quartil (Q1) Dos dados.

  • O meio da caixa (mostrado com uma linha a) representa o segundo quartil (Q2).

Além disso, há uma linha acima a caixa para indicar o máximo valor nos dados que não exceda Q3 + 1,5 x IQR e uma linha abaixo a caixa para indicar o mínimo valor nos dados que não caia abaixo Q1 - 1,5 x IQR. Os valores fora desta faixa são discrepantes e são mostrados no gráfico de caixa como pontos individuais.

Esta figura mostra um gráfico de caixa dos preços diários das ações da Microsoft a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

gráfico de caixa de cotações diárias da Microsoft.
gráfico de caixa de cotações diárias da Microsoft.

Não há outliers no estes dados. Portanto, a linha de fundo na trama caixa mostra que o menor preço durante este período foi um pouco menos de US $ 26,00, ea linha superior mostra que o maior preço foi apenas US $ 38. A parte inferior da caixa corresponde ao primeiro quartil, que é a linha $ 27.43- sólido no meio da caixa corresponde ao segundo quartil (mediana), que é 31,89 $. A parte superior da caixa corresponde ao terceiro quartil, que é 33,78 $. A altura da caixa é igual a gama interquartil (IQR), que é de $ 6,35.

Como outro exemplo, esta figura mostra um gráfico de caixa dos preços diários das ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

gráfico de caixa de preços diárias para as ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
gráfico de caixa de preços diárias para as ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

O preço mais baixo em 2013 para as ações da Apple foi de US $ 53,84, e o maior preço foi de US $ 80,11. Não há valores extremos nos dados, assim que estes valores são mostrados pela linha de fundo e linha superior, respectivamente.

O primeiro quartil, mostrado na parte inferior da caixa, foi 60,48 $. O segundo quartil foi 63,65 $ (mostrada pela linha preta sólida) e o terceiro quartil foi 70,32 $, mostrado na parte superior da caixa. Como resultado, o intervalo interquartil (IQR) é de US $ 9,84.

menu