Como novas previsões analíticas com R Regressão

Para fazer previsões analíticas com novos dados, você simplesmente usar a função com uma lista dos sete valores de atributos. O código a seguir faz esse trabalho:

> newPrediction lt; - prever (modelo, 
lista (cilindros = factor (4), o deslocamento = 370,
cavalos de potência = 150, peso = 3904, a aceleração = 12, modelYear = factor (70), origem = factor (1)),
interval = "prever", nível = .95)

Este é o código e saída do novo valor previsão:

> NewPredictionfit lwr UPR1 14,90128 8,12795 21,67462

O que você tem aqui é a sua primeira previsão real a partir do modelo de regressão. Porque é a partir de dados invisíveis e você não sabe o resultado, não é possível compará-lo com qualquer outra coisa para descobrir se era correto.

Depois de ter avaliado o modelo com o conjunto de dados de teste, e você está feliz com a sua precisão, você pode ter confiança que você construiu um bom modelo preditivo. Você vai ter que esperar por resultados de negócios para medir a eficácia de seu modelo preditivo.

Pode haver otimizações que você pode fazer para construir uma melhor e mais eficiente modelo preditivo. Ao experimentar, você pode encontrar a melhor combinação de preditores para criar um modelo mais rápido e preciso.

Um modo de construir um subconjunto de recursos é para encontrar a correlação entre as variáveis ​​e remover as variáveis ​​altamente correlacionadas. Removendo as variáveis ​​redundantes que não acrescentam nada (ou adicionar muito pouca informação) para o ajuste, você pode aumentar a velocidade do modelo. Isto é especialmente verdadeiro quando você está lidando com muitas observações (linhas de dados), onde o poder ou a velocidade de processamento pode ser um problema.

Para um grande conjunto de dados, mais atributos em uma linha de dados vai abrandar o processamento. Então você deve tentar eliminar o máximo de informações redundantes possível.

menu