Como Grupo de dados estatísticos adequadamente em um histograma
Quando você cria um histograma, é importante para agrupar os conjuntos de dados em intervalos que permitem ver padrões significativos em seus dados estatísticos. Por exemplo, digamos que você quer ver se atrizes que ganharam um Oscar eram susceptíveis de ser dentro de uma determinada faixa etária.
A imagem seguinte mostra um histograma de idades Melhores vencedores Atriz Award Academy entre 1928 e 2009.
Esta imagem mostra grupos de 5 anos cada, porque incrementos de 5 criar pausas naturais para os anos e porque fornece bares suficientes para procurar padrões gerais. Por exemplo, você pode ver que a maioria dos vencedores, cerca de 68 por cento, estavam entre as idades de 25 e 40, com um pico definido entre as idades de 30 e 35.
Tenha em mente que você não tem que usar esta grouping- particular que você tem um pouco de flexibilidade ao fazer um histograma. Aqui estão algumas dicas úteis:
Cada conjunto de dados requer diferentes gamas para os seus agrupamentos, mas você quer evitar faixas que são muito larga ou muito estreita.
Se tem um histograma gamas muito amplas para os seus grupos, ele coloca todos os dados em um número muito pequeno de barras que fazem comparações significativas impossível.
Se o histograma possui faixas muito estreitas para os seus grupos, parece que uma grande série de pequenos bares que obscurecem a imagem grande. Isso pode tornar os dados parecem muito agitado com nenhum padrão real.
Certifique-se de seus grupos têm larguras iguais. Se uma barra é mais larga do que os outros, pode conter mais dados do que deveria.
Uma solução que pode ser apropriado para o seu histograma é levar o intervalo de dados (maior minus menor) e dividir por 10 para obter 10 agrupamentos.
E se um vencedor é de 30 anos de idade? Será que ela pertence a 25-30 ou 30-35? Contanto que você é consistente com todos os pontos de dados, você pode colocar todos os pontos de fronteira em suas respectivas barras inferiores ou colocar todos eles em suas respectivas barras superiores. O importante é escolher uma direção e ser consistente. É uma prática comum fazer os intervalos da barra deixou inclusiva (Isto é, as barras incluem o ponto de extremidade esquerda, mas não da direita).