Como criar e interpretar Box Plots e Bigode de um projeto Six Sigma

Como colocar duas pessoas back-to-back para ver quem é mais alto, Sigma Seis usos Box-Whisker (ou apenas diagramas de caixa) Para comparar diretamente dois ou mais distribuições de variação. Quando você precisa para comparar as distribuições de valor para várias características, poucas coisas são mais rápidos para fazer ou mais fácil de interpretar do que um gráfico de caixa e bigode.

Um diagrama de caixa e bigode é composta de um caixa, que representa a massa central da variação, e linhas finas, chamada bigodes, que se estendem para fora em ambos os lados e representam as caudas afinamento da distribuição.

image0.jpg

Para criar uma caixa e enredo suiça, basta seguir estes passos:

  1. Classificar as medições de dados na ordem do menos para o maior.

  2. Determinar a mediana dos dados.

    Localizar o valor observado nos dados ordenou-rank onde metade dos dados encontra-se acima e metade está abaixo.

  3. Quando o número de pontos observados (n) Em seu conjunto de dados é estranho, tomar

    image1.jpg

    Esse valor na sequência ordenada-rank é a sua média. Por exemplo, se n é igual a 99, tome 99 + 1 = 100 e, em seguida, dividir esse resultado por 2 para obter 50. O número 50º na sua lista é a mediana.

  4. Quando n é ainda, a mediana é a média da

    image2.jpg

    e a

    image3.jpg

    valores na sequência ordenada-rank. E se n = 100, você encontraria 100 247- # 2 e (100 # 247- 2) + 1. Essas expressões dar-lhe 50 e 51, de modo que você encontraria o 50º e os valores 51st e média-los para encontrar a mediana.

  5. Encontre o primeiro quartil, Q1.

    o primeiro quartil marca o ponto de 25 por cento em seus sequence- três quartos ordenou-rank dos dados ainda estão por vir.

  6. Encontre o terceiro quartil, Q3.

    o terceiro quartil é o ponto de 75 por cento em sua ordenou-rank sequence- um quarto dos dados é esquerda.

  7. Encontre o maior valor observado, xMAX, e o menor valor observado, xMIN.

  8. Desenhar uma linha horizontal, representando a escala de medida para a característica.

    Esta escala pode ser em milímetros de comprimento, libras para o peso, minuto por tempo, número de defeitos encontrados em uma peça inspecionada, ou qualquer outra coisa que quantifica o aspecto da característica que você está interessado.

  9. Marque seus valores medianos e quartis de etapas de 2 a 4 e construir a caixa.

    Fazer pontos para seus valores medianos e quartis. Desenhar uma caixa que mede a partir do primeiro quartil (Q1) Para o terceiro quartil (Q3) E desenhar uma linha vertical na caixa correspondente ao valor mediano.

  10. Adicione os valores mínimos e máximos a partir do Passo 5 e construir os bigodes.

    Desenhe duas linhas horizontais, que se estende para fora do Q1 valor para o menor observação observado, xMIN,e outra que se estende para fora do Q3 valor ao maior valor observado, xMAX.

  11. Repita os passos 1 a 8 para cada característica adicional a ser plotados e comparados com a mesma escala horizontal.

Quando você tem um grande conjunto de dados relativos a uma característica, você pode querer estender os bigodes para apenas os percentis 10 e 90, ou para os 5 e 95 percentis e assim por diante, em vez de os valores máximo e mínimo. Então, quando os pontos de dados discrepantes cair além dessas extremidades dos bigodes, você pode atraí-los como pontos desligados ou estrelas.

Este método é uma ótima maneira de identificar e comunicar a presença de outliers nos dados graficamente.

Box-Whisker são ideais para comparar dois ou mais distribuições de variação, como antes e depois de vistas de um processo ou maneiras características ou alternativas de realização de uma operação. Essencialmente, quando você quer descobrir rapidamente se duas ou mais distribuições de variação são diferentes (ou o mesmo), você cria um gráfico de caixa.

Distribuição B tem claramente o nível mais baixo. Mas ainda se sobrepõe o desempenho da distribuição UMA, indicando que ele não pode ser muito diferente. Distribuição C, Por outro lado, tem um valor muito mais elevado e não sobreposição com distribuições UMA e B. Ele também tem um spread muito mais amplo para a sua variação.

Outras coisas a procurar em diagramas de caixa comparativos incluem o seguinte:

  • Diferenças ou semelhanças na localização da mediana

  • Diferenças ou semelhanças em larguras de caixa

  • Diferenças ou semelhanças, distribuídos suiça-to-suiça

  • Sobrepõem ou lacunas entre as distribuições

  • variação distorcida ou assimétrica em distribuições

  • A presença de outliers

    image4.jpg

menu