Como colocar valores limítrofes estatísticos em um histograma

Quando você cria um histograma, você precisa dividir o conjunto de dados em grupos separados. No entanto, alguns dados estatísticos pode ser bem no limite entre dois grupos. O que você faz nessas situações?

Dê uma olhada na tabela a seguir mostra Melhores vencedores Atriz Oscar Award entre 1928 e 1935:

Idades do Oscar de melhor atriz Award Winners 1928-1935
AnoVencedoraIdadeFilme
1928Laura Gainor22Nascer do sol
1929Mary Pickford37coquete
1930Norma Shearer30o divorciado
1931Marie Dressler62Min e Bill
1932Helen Hayes32O Pecado de Madelon Claudet
1933Katharine Hepburn26Glória da manhã
1934Collette Colbert31It Happened One Night
1935Bette Davis27Perigoso

Você notou que a idade de uma atriz situa-se em uma fronteira? Norma Shearer tinha 30 anos em 1930, quando ela ganhou o Oscar de A Divorciada. Agora, digamos que você dividir os grupos etários no histograma em segmentos de 5 anos (20-25, 25-30, 30-35, e assim por diante). Você colocá-la no grupo de 25-30 anos (a barra inferior) ou a faixa etária 30-35 (barra superior)?

Contanto que você é consistente com todos os pontos de dados, você pode colocar todos os pontos de fronteira em suas respectivas barras inferiores ou colocar todos eles em suas respectivas barras superiores. O importante é escolher uma direção e ser consistente.

image0.jpg

O histograma neste exemplo foi com a convenção de colocar todos os valores limítrofes em suas respectivas barras superiores - o que coloca a idade de Norma Shearer no terceiro bar, o grupo de 30-35 anos de idade do histograma. É uma prática comum fazer os intervalos da barra deixou inclusiva (Isto é, as barras incluem o ponto de extremidade esquerda, mas não da direita), tal como este exemplo faz histograma. Assim, este bar contém a idade de 30, mas não 35.

menu