Como plot_histograms com seus dados em R

Para se ter uma idéia visual mais clara sobre como os dados são distribuídos dentro da faixa, você pode traçar um histograma usando R. Para fazer um histograma para os dados de quilometragem, você simplesmente usar o hist () função, como este:

> Hist (carros $ mpg, col = "cinza")

Você vê que o hist () função corta o primeiro intervalo de dados num número de intervalos, e em seguida, conta o número de observações em cada intervalo. A altura barras é proporcional a essas frequências. No y-eixo, você encontra as contagens.

Com o argumento col, você dá as barras do histograma um pouco de cor.

image0.png

Como jogar com quebras

R escolhe o número de intervalos que considera mais útil para representar os dados, mas você pode discordar do que R faz e escolher as quebras de si mesmo. Para isso, você usar o breaks argumento do hist () função.

Você pode especificar os intervalos de duas maneiras diferentes:

  • Você pode dizer R o número de barras que você quer no histograma, dando um único número como argumento. Basta ter em mente que R ainda vai decidir se isso é realmente razoável, e tenta cortar a faixa usando números arredondados agradáveis.

  • Você pode dizer R exatamente onde colocar as quebras, dando um vetor com os pontos de quebra como um valor para a breaks argumento.

Então, se você não concordar com R e você quer ter barras que representam os intervalos de 5 a 15, 15 a 25 e 25 a 35, você pode fazer isso com o seguinte código:

> Hist (carros $ mpg, quebras = c (5,15,25,35))

Pode também indicar o nome do algoritmo de R tem de utilizar para determinar o número de quebras como o valor para o breaks argumento. Você pode encontrar mais informações sobre esses algoritmos na página de ajuda ?hist. Tente experimentar com esses algoritmos um pouco para verificar qual funciona melhor.

menu