Como usar factores ou dados numéricos em R

Antes de tentar descrever seus dados em R, você tem que certificar-se de seus dados estão no formato certo. Isso significa

  • Certificar-se de todos os seus dados estão contidos em um quadro de dados (ou num vector se é uma única variável)

  • Garantindo que todas as variáveis ​​são do tipo correcto

  • Verificando que os valores são processados ​​corretamente

Alguns dados podem ter apenas um número limitado de valores diferentes. Por exemplo, as pessoas podem ser masculino ou feminino, e você pode descrever a maioria dos tipos de cabelo com apenas algumas cores.

Às vezes mais valores são teoricamente possíveis, mas não realista. Por exemplo, os carros podem ter mais de 16 cilindros em seus motores, mas você não vai encontrar muitos deles. De uma forma ou de outra, todos estes dados podem ser vistos como categórico. Por esta definição, dados categóricos também inclui dados ordinais.

Por outro lado, você tem os dados que podem ter uma quantidade ilimitada de valores possíveis. Isso não significa necessariamente que os valores podem ser qualquer valor que quiser. Por exemplo, a quilometragem de um carro é expresso em milhas por galão, muitas vezes arredondado para toda a milha. No entanto, o valor real será um pouco diferente para cada carro.

A única coisa que define quantos valores possível você permitir é a precisão com que você expressa os dados. Os dados podem ser expressos com qualquer nível de precisão é escolhido contínuo. Ambos os dados escalonada-intervalo e de dados escalonada de relação são geralmente dados contínuos.

A distinção entre dados categóricos e contínua nem sempre é clara embora. A idade é, em essência, uma variável contínua, mas é muitas vezes expressa no número de anos desde o nascimento.

Você ainda tem um monte de valores possíveis, se você faz isso, mas o que acontece se você olhar para a idade das crianças em sua escola local? De repente, você tem apenas cinco, talvez seis, valores diferentes em seus dados. Nesse ponto, você pode obter mais fora de sua análise, se você tratar esses dados como categórica.

Ao descrever seus dados, você precisa fazer a distinção entre dados que se beneficia de ser convertido em um fator e dados que precisam ficar numérico. Se você pode visualizar seus dados como categórico, convertendo-a em um fator de ajuda com a analisá-lo.

menu