Como introduzir os dados no R regressão para análise preditiva

O conjunto de dados que vai usar neste exemplo é o conjunto de dados auto-MPG, que pode ser encontrado no repositório UCI. Este conjunto de dados tem 398 observações e 8 atributos mais o rótulo.

o rótulo é o esperado outcome- ele é usado para treinar e avaliar a precisão do modelo preditivo. O resultado que estamos tentando prever é o mpg esperado (atributo 1) de um automóvel quando dado os valores dos oito atributos.

Aqui estão os atributos na ordem da coluna em que são fornecidas:

  • mpg

  • cilindros

  • deslocamento

  • cavalo-vapor

  • peso

  • aceleração

  • ano modelo

  • origem

  • nome do carro

Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:

> autos lt; - read.csv ( "https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data",
header = FALSE, Set = "", as.is = TRUE)

Você vai ver que o conjunto de dados foi carregado na memória como a variável de estrutura de dados autos, olhando para o seu painel de espaço de trabalho (o painel superior direito). Clique no autos variável para ver os valores de dados em painel de origem (o painel superior esquerdo).

image0.jpg

Bache, K. Lichman, M. (2013). Repositório de Aprendizagem UCI Machine [https://archive.ics.uci.edu/ml]. Irvine, CA: Universidade da Califórnia, Escola de Informação e Ciência da Computação.

Usando as funções de cabeça e cauda pode vir a calhar, por vezes, se você só quer ver os primeiros e últimos cinco linhas de dados. Esta é também uma maneira rápida de verificar se você realmente carregado o arquivo correto e foi lido corretamente. A função pode dar-lhe estatísticas básicas sobre cada coluna dos dados.

Você pode copiar e colar o seguinte três linhas de código no painel de origem e ter a saída mostrada na consola:

cabeça (automóveis, 5) da cauda (automóveis, 5) resumo (automóveis)

menu