Como fazer um Boxplot de um resumo dos cinco números

UMA boxplot é um gráfico uni-dimensional de dados numéricos com base na síntese de cinco números. Este resumo inclui as seguintes estatísticas: o valor mínimo, o percentil 25 (conhecido como Q1), A mediana, o percentil 75 (Q3), E o valor máximo. Em essência, estes cinco estatística descritiva dividir o conjunto de dados em quatro partes, em que cada parte contém 25% dos dados.

Para fazer um boxplot, siga estes passos:

  1. Encontre o resumo dos cinco números do seu conjunto de dados:

    o mínimo é o menor valor no conjunto de dados, eo máximo é o maior valor no conjunto de dados. Utilize os seguintes passos para encontrar o percentil 25 (conhecido como Q1), O percentil 50 (mediana) e do percentil 75 (Q3).

  1. Encomendar todos os valores no conjunto de dados do menor ao maior.

  2. Multiplicar k por cento vezes o número total de valores de dados, nas n.

    O resultado é conhecido como o índice.

  3. Se o índice obtido no Passo 2 não for um número inteiro, arredondar para o número inteiro mais próximo e ir para a Etapa 4a.

    Se o índice obtido no Passo 2 é um número inteiro, vá para a Etapa 4b.

  4. Escolha um dos seguintes.

    uma. Contar os valores em seu conjunto de dados da esquerda para a direita (do menor para o maior valor) até chegar ao número indicado pelo Passo 3. O valor correspondente em seu conjunto de dados é o kº percentil.

    b. Contar os valores em seu conjunto de dados da esquerda para a direita (menor para o maior) até chegar ao número indicado pelo Passo 2. O kº percentil é a média desse valor correspondente no seu conjunto de dados e o valor que o segue diretamente.

  • Criar uma vertical (ou horizontal) o número da linha cuja escala inclui os valores no resumo dos cinco números e usa unidades adequadas de igual distância uns dos outros.

  • Marcar a localização de cada valor no resumo de cinco números um pouco acima da linha de número (por um boxplot horizontal) ou apenas para a direita da linha de número (por um boxplot vertical).

  • Desenhar uma caixa em torno das marcas para o percentil 25 e o percentil 75.

  • Desenhar uma linha na caixa onde a mediana está localizado.

  • Determinar se ou não de outliers estão presentes.

    Para fazer essa determinação, calcular o intervalo interquartílico (IQR), que se encontra por subtracção Q3 - Q1- em seguida, multiplicar IQR 1,5. Adicionar este valor ao valor do Q3e subtrair esse valor do Q1. Isto dá-lhe um limite mais amplo em torno da mediana do que a caixa faz. Quaisquer pontos de dados que caem fora desse limite estão determinados a ser discrepantes.

  • Se não houver valores atípicos (de acordo com os resultados da Etapa 6), desenhar linhas a partir das bordas superior e inferior da caixa para o valores mínimo e máximo do conjunto de dados.

  • Se houver valores atípicos (de acordo com os resultados da Etapa 6), indicar a sua localização no boxplot com sinais *.

    Em vez de desenhar uma linha a partir da borda da caixa de todo o caminho até o outlier mais extremo, parar a linha no último valor de dados que não é um caso isolado.

  • Muitos, se não a maioria dos pacotes de software indicam valores discrepantes em um conjunto usando um asterisco (*) ou estrela símbolo e usar o procedimento descrito no Passo 6 para identificar valores discrepantes de dados. No entanto, nem todos os pacotes de usar esses símbolos e Procedimentos- verificar para ver o que o seu pacote faz antes de analisar seus dados com um boxplot.

    Boxplot de Melhores idades Actriz (1928 -2009- & lt; i>NLT;. / i> = 83 atrizes)
    Boxplot de Melhores idades Atriz (1928-2009- n = 83 atrizes).

    Um boxplot horizontal para as idades dos Oscar Melhor Atriz vencedores de 1928-2009 é mostrado na figura acima. Você pode ver os números que separa seções do boxplot corresponder às estatísticas resumo dos cinco números mostrados na figura a seguir.

    Estatística Descritiva para Melhores idades Atriz (1928-2009).
    Estatística Descritiva para Melhores idades Atriz (1928-2009).

    Boxplots pode ser vertical (para cima e para baixo) com os valores no eixo que vai da parte inferior (mais baixo) ao topo (mais alto) - ou eles podem ser horizontal, com os valores no eixo indo da esquerda (mais baixo) para a direita (mais alto ).

    Os passos aqui apresentados demonstram uma maneira de calcular a mediana e quartis do resumo de cinco números e de construção do boxplot. Mas há vários outros métodos aceitáveis. Não seja muito alarmado se sua calculadora ou um amigo lhe dá um boxplot perto, mas diferente do que estes passos daria.

    menu