Como criar um gráfico de estrutura no R

Explorar gelosia

gráficos em R, primeiro dar uma olhada no conjunto de dados built-in mtcars. Esse conjunto de dados contém 32 observações de automóveis e informações sobre o motor, como o número de cilindros, automática versus caixa de velocidades manual, e potência do motor.

Todos os conjuntos de dados built-in de R também têm boa informação ajuda que você pode acessar através do mecanismo de ajuda - por exemplo, digitando ?mtcars na consola R.

> Str (mtcars) 'data.frame': 32 obs. de 11 variáveis: $ mpg: num 21 21 22,8 21,4 18,7 18,1 14,3 24,4 22,8 19,2 ... $ CYL: num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ cv: num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3,9 3,9 3,85 3,08 3,15 2,76 3,21 3,69 3,92 3,92 ... $ em peso: num 2,62 2,88 2,32 3,21 3,44 ... $ qsec: num 16,5 17 18,6 19,4 17 ... $ vs: num 0 0 1 1 0 1 0 1 1 1 ... $ am: num 1 1 1 0 0 0 0 0 0 0 ... $ engrenagem: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: Num 4 4 1 1 2 1 4 2 2 4 ..

Digamos que você queira explorar a relação entre economia de combustível e potência do motor. o mtcars conjunto de dados tem dois elementos com esta informação:

  • mpg: A economia de combustível medida em milhas por galão (mpg)

  • hp: potência do motor medida em cavalos (hp)

Apesar de gelosia formas de pacotes parte da distribuição R, você tem que dizer a R que você planeja usar o código neste pacote. Você pode fazer isso com o biblioteca() função. Lembre-se que você precisa fazer isso no início de cada sessão R limpa, nos quais você deseja usar gelosia:

> biblioteca ( "rede")

Faça um gráfico de dispersão da estrutura

o gelosia pacote tem um número de funções diferentes para criar tipos diferentes de trama. Por exemplo, para criar uma dispersão, utilizar o xyplot () função. Observe que isso é diferente de gráficos de base, onde o enredo() função cria uma variedade de diferentes tipos de gráficos (por causa do mecanismo de envio método).

Fazer um gelosia enredo, você precisa especificar pelo menos dois argumentos:

  • Fórmula: Esta é uma fórmula tipicamente a forma de y ~ x | z. Isso significa que para criar um terreno de y contra x, em condicional z. Em outras palavras, criar um gráfico para cada valor único de z. Cada uma das variáveis ​​na Fórmula Tem que haver uma coluna no quadro de dados que você especificar no dados argumento.

  • dados: Um quadro de dados que contém todas as colunas que você especificar na Fórmula argumento.

Este exemplo deve deixar claro:

> Xyplot (mpg ~ hp | fator (cyl), dados = mtcars)

Você pode ver isso:

  • as variáveis mpg, hp, e cil são colunas no quadro de dados mtcars.

  • Apesar cil é um vector numérico, o número de cilindros em um carro pode ser apenas números inteiros (ou variáveis ​​discretas, no jargão estatístico). Por usar fator (cyl) em seu código, você diz que R cil é, de facto, uma variável discreta. Se você esquecer de fazer isso, R ainda vai criar um gráfico, mas os rótulos das tiras no topo de cada painel será exibido de forma diferente.

Como cada um dos carros no quadro de dados tem quatro, seis ou oito cilindros, o gráfico tem três painéis. Você pode ver que os carros com motores maiores tendem a ter mais poder (hp) E mais pobre consumo de combustível (mpg).

image0.jpg

Adicionar linhas de tendência

Quando você diz gelosia para calcular uma linha de melhor ajuste, ele faz isso para cada painel na trama. Este é simples usando xyplot (), porque é tão simples quanto adicionar um digitar argumento. Em particular, você quer especificar que o tipo é os dois pontos (type = "p") E regressão (type = "r"). Você pode combinar diferentes tipos com o c () função, como este:

image1.jpg
> Xyplot (mpg ~ cv | fator (cyl), os dados = mtcars, + type = c ( "p", "r"))

menu