Como definir o Modo de Exibição de Dados em R
UMA ggplot2
Menu
A geom define o layout de um ggplot2 camada. Por exemplo, existem Geoms para criar gráficos de barras, gráficos de dispersão, e diagramas de linha (bem como uma variedade de outras parcelas).
Cada geom tem uma estatística padrão, e cada um tem um status geom padrão. Na prática, você tem que especificar apenas um destes.
Geom | Descrição | Stat padrão |
---|---|---|
geom_bar () | Gráfico de barras | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | diagrama de linha, ligando observações em ordenados porx-valor | stat_identity () |
geom_boxplot | gráfico de caixa-and-whisker | stat_boxplot () |
geom_path | diagrama de linha, observações de ligação na ordem original | stat_identity () |
geom_smooth | Adicionar uma média condicionado alisou | stat_smooth () |
geom_histogram | Um alias para geom_bar () e stat_bin () | stat_bin () |
Como criar um gráfico de barras usando ggplot2 em R
Para fazer um gráfico de barras que você use o geom_bar () função. No entanto, note que a estatística padrão é stat_bin (), que é usado para cortar os seus dados em caixas. Assim, o comportamento padrão do geom_bar () é criar um histograma.
Por exemplo, para criar um histograma da profundidade de sismos no terremotos conjunto de dados, faça o seguinte:
> Ggplot (terremotos, aes (x = profundidade)) + geom_bar ()> ggplot (terremotos, aes (x = profundidade)) + geom_bar (binwidth = 50)
Observe que o mapeamento define apenas o x-variável do eixo (neste caso, abalos de profundidade $). Um argumento útil geom_bar () é binwidth, que controla o tamanho das caixas de que os seus dados são cortados em.
Então se geom_bar () faz um histograma por padrão, como você faz um gráfico de barras? A resposta é que você primeiro tem que agregar seus dados e, em seguida, especificar o argumento status = "identidade" em sua chamada para geom_bar ().
No próximo exemplo, você usar agregar() para calcular o número de terremotos em diferentes estratos de profundidade:
> quakes.agg lt; - agregado (mag ~ rodada (profundidade, -1), data = tremores, + FUN = comprimento)> nomes (quakes.agg) lt; - c ( "profundidade", "mag")
Agora você pode traçar o objeto quakes.agg com geom_bar (status = "identidade"):
> Ggplot (quakes.agg, aes (x = profundidade, y = mag)) ++ geom_bar (status = "identidade")
Em resumo, você pode usar geom_bar () para criar um histograma e deixar ggplot2 resumir seus dados, ou você pode pré-resumir seus dados e então usar status = "identidade" para traçar um gráfico de barras.
Como fazer um gráfico de dispersão em ggplot2
Para criar um gráfico de dispersão, você usa o geom_point () função. A dispersão cria pontos (ou, por vezes, bolhas ou outros símbolos) em seu gráfico. Cada ponto corresponde a uma observação em seus dados.
Você provavelmente já viu ou criado este tipo de gráficos um milhão de vezes, então você já sabe que scatterplots usar o sistema cartesiano, onde uma variável é mapeada para a coordenada x-eixo e uma segunda variável é mapeado para o y-eixo.
Exactamente da mesma maneira, em ggplot2 você cria um mapeamento entre x-e eixo y-variáveis de eixos. Então, para criar um gráfico do terremotos de dados, mapear treme $ longa ao x-e eixo tremores $ lat ao y-eixo:
> Ggplot (terremotos, aes (x = comprimento, y = lat)) + geom_point ()
Como criar gráficos de linha ggplot2
Para criar um gráfico de linhas, você pode usar o geom_line () função. Esta função é utilizada de uma forma muito semelhante à geom_point (), com a diferença de que geom_line () desenha uma linha entre pontos consecutivos em seus dados.
Este tipo de gráfico é útil para dados de séries temporais em quadros de dados, como os dados de população no conjunto de dados built-in longley. Para criar um gráfico de linha de figuras de desemprego, você usa o seguinte:
> Ggplot (Longley, aes (x = Ano, y = Desempregados)) + geom_line ()