Como carregar os dados em um modelo de R Classification Predictive Analytics
O conjunto de dados analisamos para fazer uma previsão sobre o conjunto de dados de sementes, que podem ser encontrados no repositório UCI aprendizado de máquina. Este conjunto de dados tem 210 observações e 7 atributos mais o rótulo. O rótulo é o resultado esperado e é usado para treinar e avaliar a precisão do modelo preditivo.
O resultado que você está tentando prever é o tipo de semente é (atributo 8), tendo em conta os valores dos sete atributos. Os três valores possíveis para o tipo de semente são rotulados 1, 2 e 3, e representam o Kama, Rosa, e variedades canadenses de trigo.
Os atributos na ordem da coluna são fornecidas:
área
perímetro
compacidade
comprimento de núcleo
largura do núcleo
coeficiente de assimetria
comprimento de ranhura de kernel
classe de trigo
Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:
> sementes lt; -
read.csv ( "https://archive.ics.uci.edu/ml/machine~~number=plural -Learning-bases de dados / 00236 / seeds_dataset.txt", header = false, Set = "", as.is = true)
Você vê que o conjunto de dados foi carregado na memória como a variável de estrutura de dados sementes, olhando para o seu painel de espaço de trabalho (canto superior direito). Clique no sementes variável para ver os valores de dados em painel de origem (canto superior esquerdo). Esta é a aparência dos dados no painel de origem.
Você pode encontrar mais informações sobre os dados que você acabou de carregado usando o resumo() função.
> Resumo (sementes) V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 primeiro Qu.:13.45 primeiro Qu.:0.8569Median: 14,36 Median: 14,32 Median: 0.8734Mean: 14.85 Média: 14,56 Média: 0.87103rd Qu.:17.30 3ª Qu.:15.71 3ª Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0,9183 ...