Como usar Analytics supervisionadas para treinar modelos preditivos

Dentro analytics supervisionadas, entrada e de saída preferida, fazem parte dos dados de formação. O modelo de análise preditiva é apresentado com os resultados corretos como parte de seu processo de aprendizagem. Tal aprendizado supervisionado assume exemplos pré-classificados: O objetivo é fazer com que o modelo de aprender com a classificação anteriormente conhecido por isso pode rotular corretamente o próximo ponto de dados desconhecida com base no que ele aprendeu.

Quando o treinamento do modelo está completo, uma função matemática é inferida através da análise dos dados de treinamento. Essa função irá ser utilizado para rotular os novos pontos de dados.

Para que esta abordagem funcione corretamente, os dados de treinamento - juntamente com os dados de teste - devem ser cuidadosamente selecionados. O modelo treinado deve ser capaz de prever a etiqueta correcta para um novo ponto de dados com rapidez e precisão, com base no tipo (s) de dados que o modelo tenha visto nos dados de treino.

analytics supervisionadas oferecer algumas vantagens distintas:

  • O analista é responsável do processo.

  • Rotulagem se baseia em classificações conhecidas.

  • erros de rotulagem pode ser facilmente resolvido.

O outro lado dessas vantagens é um conjunto igualmente distinta de potenciais desvantagens:

  • Quaisquer erros na fase de treinamento será reforçado mais tarde.

  • A classificação fornecida pelo analista pode não descrever toda a população de forma adequada.

  • O modelo pode ser incapaz de detectar as classes que se desviam do conjunto de treino inicial.

  • O pressuposto de que os grupos dentro dos dados não se sobrepõem - e que eles possam ser facilmente separados - não pode provar válido.

menu