Box Plots: técnica gráfica de dados estatísticos
UMA gráfico de caixa é projetado para mostrar várias estatísticas-chave para um conjunto de dados sob a forma de um retângulo ou caixa vertical. As estatísticas mostram que pode incluir o seguinte:
valor mínimo
Valor máximo
Primeiro quartil (Q1)
Segundo quartil (Q2)
Terceiro quartil (Q3)
intervalo interquartil (IQR)
o primeiro quartil de um conjunto de dados é uma medida numérica que divide os dados em duas partes: o menor de 25 por cento das observações e a maior de 75 por cento das observações. Em outras palavras, o primeiro quartil é um valor numérico com as seguintes propriedades:
25 por cento das observações do conjunto de dados são menor que o primeiro quartil.
75 por cento das observações do conjunto de dados são Melhor que o primeiro quartil.
Da mesma forma, o segundo quartil (Também conhecido como o mediana) Divide os dados ao meio, de modo que 50 por cento dos elementos são menores do que a mediana, e 50 por cento são maiores.
o terceiro quartil é o valor para o qual a seguir forem verdadeiras:
75 por cento das observações do conjunto de dados são menor que o terceiro quartil.
25 por cento das observações do conjunto de dados são Melhor que o terceiro quartil.
o intervalo interquartil (IQR) é a diferença entre o terceiro quartil e primeiro quartil: IQR = Q3 - Q1.
O intervalo interquartílico é uma medida de dispersão- que mostra a quantidade de propagação existe entre os elementos na média 50 por cento de um conjunto de dados.
Um gráfico de caixa é desenhada de modo a que
A parte superior da caixa representa o terceiro quartil (Q3) Dos dados.
A parte inferior da caixa representa o primeiro quartil (Q1) Dos dados.
O meio da caixa (mostrado com uma linha a) representa o segundo quartil (Q2).
Além disso, há uma linha acima a caixa para indicar o máximo valor nos dados que não exceda Q3 + 1,5 x IQR e uma linha abaixo a caixa para indicar o mínimo valor nos dados que não caia abaixo Q1 - 1,5 x IQR. Os valores fora desta faixa são discrepantes e são mostrados no gráfico de caixa como pontos individuais.
Esta figura mostra um gráfico de caixa dos preços diários das ações da Microsoft a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
Não há outliers no estes dados. Portanto, a linha de fundo na trama caixa mostra que o menor preço durante este período foi um pouco menos de US $ 26,00, ea linha superior mostra que o maior preço foi apenas US $ 38. A parte inferior da caixa corresponde ao primeiro quartil, que é a linha $ 27.43- sólido no meio da caixa corresponde ao segundo quartil (mediana), que é 31,89 $. A parte superior da caixa corresponde ao terceiro quartil, que é 33,78 $. A altura da caixa é igual a gama interquartil (IQR), que é de $ 6,35.
Como outro exemplo, esta figura mostra um gráfico de caixa dos preços diários das ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
O preço mais baixo em 2013 para as ações da Apple foi de US $ 53,84, e o maior preço foi de US $ 80,11. Não há valores extremos nos dados, assim que estes valores são mostrados pela linha de fundo e linha superior, respectivamente.
O primeiro quartil, mostrado na parte inferior da caixa, foi 60,48 $. O segundo quartil foi 63,65 $ (mostrada pela linha preta sólida) e o terceiro quartil foi 70,32 $, mostrado na parte superior da caixa. Como resultado, o intervalo interquartil (IQR) é de US $ 9,84.