Como distinguir tipos de dados em R

No campo de dados estatísticos, sendo capaz de distinguir entre diferentes tipos de variáveis ​​é muito importante. O tipo de dados muitas vezes determina o tipo de análise que pode ser executada. Como resultado, R oferece a possibilidade de classificar explicitamente dados como se segue:

  • Dados Nominal: Este tipo de dados, o que você representa em R usando fatores, distingue entre as diferentes categorias, mas não há nenhuma ordem implícita entre as categorias. Exemplos de dados nominais são as cores (vermelho, verde, azul), sexo (masculino, feminino), e nacionalidade (britânica, francesa, japonesa).

  • dados ordinais: datais ordinais distinguido pelo fato de que há algum tipo de ordem natural entre elementos, mas nenhuma indicação da diferença de tamanho relativo. Qualquer tipo de dados que é possível classificar em ordem, mas não dar valores exatos para é ordinal. Por exemplo, baixo lt; médio lt; Alto descreve dados que são solicitados com três níveis.

    Em uma pesquisa de mercado, é muito comum o uso de uma escala de cinco pontos para medir as percepções: discordo fortemente lt; discordar lt; neutro lt; concordar lt; concordo plenamente. Este é também um exemplo de dados ordinais.

    Outro exemplo é a utilização dos nomes de cores para indicar fim, tal como vermelho lt; âmbar lt; verde para indicar o status do projeto.

    Em R, você usa fatores ordenados para descrever os dados ordinais.

  • dados numéricos: Você tem dados numéricos quando você pode descrever seus dados com números (por exemplo, comprimento, peso, ou contagem). Dados numéricos tem duas subcategorias.

  • Intervalo de dados escalonada: Você intervalo dimensionado de dados quando o intervalo entre unidades adjacentes de medição é a mesma, mas o ponto zero é arbitrária. Um exemplo cotidiano de dados escalonada intervalo é o nosso sistema de calendário. Cada ano tem o mesmo comprimento, mas o ponto zero é arbitrária. Em outras palavras, o tempo não foi iniciado no ano zero -Basta use um ano conveniente para iniciar a contagem. Isto significa que você pode adicionar e subtrair datas (e todos os outros tipos de dados em escala de intervalo), mas você não pode significativamente dividir datas. Outros exemplos incluem longitude, bem como qualquer outra coisa onde não pode haver desacordo sobre onde o ponto de partida é.

    Outros exemplos de dados de intervalo escalado pode ser encontrado em pesquisa em ciências sociais, tais como pesquisa de mercado.

    Em R você pode usar número inteiro ou numérico objetos para representar os dados de intervalo escalado.

  • Proporção dimensionado dados: Isto é onde os dados são permitidos de todos os tipos de operações matemáticas, em particular a capacidade de multiplicar e dividir (em outras palavras, ter rácios). A maioria dos dados em ciências físicas estão rácio escalados - por exemplo, comprimento, massa e velocidade. Em R, você usa numérico objetos para representar os dados de relação escalado.

menu