Prever valores do cliente com a linha de regressão

Enquanto uma correlação fala para a força de uma relação entre duas variáveis, e o r2 ajuda a explicar que a força do relacionamento, o que você precisa fazer para prever uma variável de outro é a utilização de uma extensão da correlação chamada de análise de regressão. Análise de regressão é conhecido como um # 147-cavalo de batalha # 148- em análise preditiva. A matemática não é muito complicado, ea maioria dos pacotes de software de suporte à análise de regressão.

A análise de regressão estende a idéia da dispersão utilizado em correlação e adiciona uma linha que melhor # 147 se encaixa # 148- os dados.

Um dos requisitos da utilização de correlações e a análise de regressão é que a informação é linear. Linear significa uma linha razoavelmente descrever a relação entre variáveis ​​e, em seguida, ser usada para prever valores que não aparecem em seus dados (pontos futuro de dados do cliente). Se a dispersão de seus dados forma uma curva, ou qualquer forma que uma linha não se encaixa bem, você pode obter resultados enganosos.

Embora existam muitas maneiras para desenhar linhas por meio dos dados, a análise dos mínimos quadrados é uma forma matemática que reduz a distância entre a linha e cada ponto no gráfico de dispersão. Esta análise pode ser feito à mão ou usando softwares como o Minitab, SPSS, SAS, R, ou Excel.

A Figura mostra uma linha de regressão de mínimos quadrados.

image0.jpg

O software dá-lhe a equação para a linha de regressão acima do gráfico:

Tempo = 86,57 + 4.486 Taps

A equação de regressão toma a forma geral de

image1.jpg

Aqui está uma explicação de cada parte da equação:

image2.jpg

(Pronuncia-y-hat): Este é o valor predito da variável dependente: tempo previsto.

  • b0: Chamou o y-interceptar, é neste ponto que a linha iria atravessar (ou intercepção) com o y-eixo.

  • b1: Este é o declive da linha previsto (como íngreme é).

  • X: Isto representa um determinado valor da variável independente: torneiras.

  • e: representa o erro inevitável a previsão irá conter.

Assim, neste exemplo, a equação de regressão, que indica a quantidade prevista de tempo que leva um cliente para fazer uma compra é igual a 86,57 (a y-intercepto) mais 4,486 (declive) multiplicado pelo número de machos (X).

É a fórmula de regressão que permite prever os valores dos clientes que não existem em seus dados. Ele permite que você execute # 147-what-if # 148- análises sobre os valores do cliente futuras. Isto é o # 147 preditivo # 148- parte de análise de clientes preditivos.

Por exemplo, usando a equação de regressão do exemplo anterior, você pode prever quanto tempo um cliente leva para fazer uma compra com 38 torneiras. Você acabou de preencher 38 na equação de regressão.

Tempo = 86,57 + 4,486 (38)
Tempo = 86,57 + 170,47 = 257,04

Um cliente precisa de 257 segundos, ou um pouco mais de quatro minutos, para fazer uma compra que requer 38 torneiras.

A variável dependente é denotado # 147-Y # 148- e é mostrado no eixo y (vertical). A variável independente é chamado X e é apresentado no eixo horizontal (x).

Em vez de prever o tempo tarefa de um cliente de torneiras, esta mesma abordagem pode ser usada para prever outros análise de clientes, incluindo:

  • receitas de clientes das receitas publicitárias

  • Probabilidade de recomendar a partir de dados usabilidade

  • Número de conversões de páginas vistas website

menu