Como carregar dados em um SVM Supervisionado Aprendizagem Modelo
Para a análise preditiva, você precisa carregar os dados para seus algoritmos de usar. Carregando o conjunto de dados Iris em scikit é tão simples como a emissão de um par de linhas de código, pois scikit já criou uma função para carregar o conjunto de dados.
sepal Comprimento | sepal Largura | Comprimento pétala | pétala Largura | Classe Alvo / etiqueta |
---|---|---|---|---|
5.1 | 3,5 | 1.4 | 0,2 | Setosa (0) |
7 | 3.2 | 4.7 | 1.4 | Versicolor (1) |
6.3 | 3.3 | 6 | 2.5 | Virginica (2) |
Abra uma nova sessão do shell interativo do Python.
Use uma nova sessão de Python, então não há nada de sobra na memória e você tem uma ardósia limpa para trabalhar.
Digite o seguinte código no alerta e observar a saída:
>>> From sklearn.datasets importar load_iris >>> iris = load_iris ()
Depois de executar essas duas declarações, você não deve ver as mensagens do intérprete. a variável íris deve conter todos os dados a partir da iris.csv Arquivo.
Antes de criar um modelo preditivo, é importante entender um pouco sobre a nova variável íris eo que você pode fazer com ele. Isso torna o código mais fácil de seguir e o processo muito mais simples de entender. Você pode inspecionar o valor de íris digitando-a no interpretador.
>>> iris
A saída será todo o conteúdo a partir do iris.csv arquivo, junto com algumas outras informações sobre o conjunto de dados que o load_iris função carregada na variável. A variável é uma estrutura de dados dicionário com quatro propriedades principais. As propriedades importantes de íris estão listados abaixo.
Nome da propriedade | Descrição |
---|---|
dados | Contém todas as medições das observações. |
feature_name | Contém o nome do recurso (nome do atributo). |
alvo | Contém todos os alvos (etiquetas) das observações. |
target_names | Contém os nomes das classes. |
Pode imprimir os valores no interpretador digitando o nome da variável seguido por ponto seguido pelo nome da propriedade. Um exemplo é usar iris.data para acessar a propriedade de íris, como isso:
>>> iris.data
Esta é uma maneira padrão de como acessar as propriedades de um objeto em muitas linguagens de programação.
Para criar uma instância do classificador SVM, digite o seguinte código no interpretador:
>>> From sklearn.svm importação LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
A primeira linha de código importa a linear SVC biblioteca na sessão. O Support Vector classificador linear (SVC) é uma implementação de SVM para a classificação linear e tem suporte multi-classe. O conjunto de dados é um pouco linearmente separáveis e tem três classes, de modo que seria uma boa idéia para experimentarlinear SVC para ver como ele se comporta.
A segunda linha cria a instância usando a variável svmClassifier. Esta é uma variável importante para se lembrar. o aleatória_Estado parâmetro permite reproduzir estes exemplos e obter os mesmos resultados. Se você não colocar no aleatória_Estado parâmetro, os resultados podem ser diferentes das mostradas aqui.