Como usar Analytics supervisionadas para treinar modelos preditivos
Dentro analytics supervisionadas, entrada e de saída preferida, fazem parte dos dados de formação. O modelo de análise preditiva é apresentado com os resultados corretos como parte de seu processo de aprendizagem. Tal aprendizado supervisionado assume exemplos pré-classificados: O objetivo é fazer com que o modelo de aprender com a classificação anteriormente conhecido por isso pode rotular corretamente o próximo ponto de dados desconhecida com base no que ele aprendeu.
Quando o treinamento do modelo está completo, uma função matemática é inferida através da análise dos dados de treinamento. Essa função irá ser utilizado para rotular os novos pontos de dados.
Para que esta abordagem funcione corretamente, os dados de treinamento - juntamente com os dados de teste - devem ser cuidadosamente selecionados. O modelo treinado deve ser capaz de prever a etiqueta correcta para um novo ponto de dados com rapidez e precisão, com base no tipo (s) de dados que o modelo tenha visto nos dados de treino.
analytics supervisionadas oferecer algumas vantagens distintas:
O analista é responsável do processo.
Rotulagem se baseia em classificações conhecidas.
erros de rotulagem pode ser facilmente resolvido.
O outro lado dessas vantagens é um conjunto igualmente distinta de potenciais desvantagens:
Quaisquer erros na fase de treinamento será reforçado mais tarde.
A classificação fornecida pelo analista pode não descrever toda a população de forma adequada.
O modelo pode ser incapaz de detectar as classes que se desviam do conjunto de treino inicial.
O pressuposto de que os grupos dentro dos dados não se sobrepõem - e que eles possam ser facilmente separados - não pode provar válido.