Como carregar dados em um SVM Supervisionado Aprendizagem Modelo

Para a análise preditiva, você precisa carregar os dados para seus algoritmos de usar. Carregando o conjunto de dados Iris em scikit é tão simples como a emissão de um par de linhas de código, pois scikit já criou uma função para carregar o conjunto de dados.

sepal Comprimentosepal LarguraComprimento pétalapétala LarguraClasse Alvo / etiqueta
5.13,51.40,2Setosa (0)
73.24.71.4Versicolor (1)
6.33.362.5Virginica (2)
  1. Abra uma nova sessão do shell interativo do Python.

    Use uma nova sessão de Python, então não há nada de sobra na memória e você tem uma ardósia limpa para trabalhar.

  2. Digite o seguinte código no alerta e observar a saída:

    >>> From sklearn.datasets importar load_iris >>> iris = load_iris ()

    Depois de executar essas duas declarações, você não deve ver as mensagens do intérprete. a variável íris deve conter todos os dados a partir da iris.csv Arquivo.

Antes de criar um modelo preditivo, é importante entender um pouco sobre a nova variável íris eo que você pode fazer com ele. Isso torna o código mais fácil de seguir e o processo muito mais simples de entender. Você pode inspecionar o valor de íris digitando-a no interpretador.

>>> iris

A saída será todo o conteúdo a partir do iris.csv arquivo, junto com algumas outras informações sobre o conjunto de dados que o load_iris função carregada na variável. A variável é uma estrutura de dados dicionário com quatro propriedades principais. As propriedades importantes de íris estão listados abaixo.

Nome da propriedadeDescrição
dadosContém todas as medições das observações.
feature_nameContém o nome do recurso (nome do atributo).
alvoContém todos os alvos (etiquetas) das observações.
target_namesContém os nomes das classes.

Pode imprimir os valores no interpretador digitando o nome da variável seguido por ponto seguido pelo nome da propriedade. Um exemplo é usar iris.data para acessar a propriedade de íris, como isso:

>>> iris.data

Esta é uma maneira padrão de como acessar as propriedades de um objeto em muitas linguagens de programação.

Para criar uma instância do classificador SVM, digite o seguinte código no interpretador:

>>> From sklearn.svm importação LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)

A primeira linha de código importa a linear SVC biblioteca na sessão. O Support Vector classificador linear (SVC) é uma implementação de SVM para a classificação linear e tem suporte multi-classe. O conjunto de dados é um pouco linearmente separáveis ​​e tem três classes, de modo que seria uma boa idéia para experimentarlinear SVC para ver como ele se comporta.

A segunda linha cria a instância usando a variável svmClassifier. Esta é uma variável importante para se lembrar. o aleatória_Estado parâmetro permite reproduzir estes exemplos e obter os mesmos resultados. Se você não colocar no aleatória_Estado parâmetro, os resultados podem ser diferentes das mostradas aqui.

menu