Como se preparar dados no R

Com R na ponta dos dedos, você pode rapidamente dar forma a seus dados exatamente como você quer. Isso é bom porque, em muitos casos da vida real, você obtém montes de dados em um arquivo grande, e de preferência em um formato que você não pode usar em tudo. Essa deve ser a regra de ouro de coleta de dados: Certifique-se de seu estatístico transpira suas calças só de olhar para os dados.

Selecionando apenas as variáveis ​​que você precisa e transformá-los para o formato direito torna-se muito fácil com truques em R.

Vamos preparar o quadro de dados mtcars um pouco o uso de alguns truques simples. Primeiro, crie um quadro de dados carros como isso:

> carros lt; - mtcars [c (1,2,9,10)]> carros $ engrenagem lt; - ordenado (carros $ engrenagem)> cars $ am lt; - fatores (carros $ am, etiquetas = c ( 'auto', 'manual'))

Com este código, faça o seguinte:

  • Selecione quatro variáveis ​​do quadro de dados mtcars e guardá-las em um quadro de dados chamado carros. Note-se que você usa o sistema de indexação para listas para selecionar as variáveis.

  • Faça a variável engrenagem nestes dados enquadrar um fator ordenada.

  • Dê a variável sou O valor que 'auto' se seu valor original é 1, e 'manual' se seu valor original é 0.

  • Transformar a nova variável sou a um factor.

Na conversão de carros $ am, você notar que o primeiro argumento do ifelse () declaração não é uma expressão lógica. A variável original tem 0 e 1 como valores, e R lê um 0 Como FALSO e tudo o mais, como VERDADE. Você pode usar essa propriedade em seu próprio código, como mostrado anteriormente.

Depois de executar este código, você deve ter um conjunto de dados carros em seu espaço de trabalho com a seguinte estrutura:

> Str (carros) 'data.frame': 32 obs. de 4 variáveis: $ mpg: Nm 21 ​​21 22,8 21,4 18,7 ... $ CYL: num 6 6 4 6 8 ... $ am: Fator w / 2 níveis de "auto", "Manual": 1 1 1 2 2. .. $ engrenagem: Ord.factor w / 3 níveis "3" lt; "4" lt; "5": 2 2 2 1 1 ...

menu