Como calcular Regressão Linear Múltipla for Six Sigma
O que deve praticantes de Seis Sigma fazer com todas as situações em que mais de um x uma influencia Y? Você usa de regressão linear múltipla.Afinal de contas, esse tipo de situação é mais comum do que uma única variável que influencia é. Quando você trabalha para criar uma equação que inclui mais de uma variável - como Y = f(x1, x2, . . ., xn).
A forma geral do modelo de regressão linear múltipla é simplesmente uma extensão do modelo de regressão linear simples Por exemplo, se você tem um sistema onde x1 e x2 ambos contribuem para Y, o modelo de regressão linear múltipla torna-se
YEu= # 946-0 + # 946-1x1 + # 946-11x12 + # 946-2x2 + # 946-22x22 + # 946-12x1x2 + # 949-
Essa equação apresenta cinco tipos distintos de termos:
# 946-0: Este termo é a efeito global. Ele define o nível de partida para todos os outros efeitos, independentemente do que o x variáveis são definidas pelo.
# 946-EuxEu: O # 946-1x1 e # 946-2x2 peças são o efeitos principais termos na equação. Assim como no modelo de regressão linear simples, estes termos captar o efeito linear cada xEu tem na saída Y. A magnitude ea direção de cada um destes efeitos são capturados no associados # 946-Eu coeficientes.
# 946-iixEu2: # 946-11x12 e # 946-22x22 são as segunda ordem ou efeitos quadrados para cada um dos xs. Uma vez que a variável é elevada à segunda potência, o efeito é quadrática e não lineares. A magnitude ea direção de cada um desses efeitos de segunda ordem são indicados pela Associated # 946-ii coeficientes.
# 946-12x1x2: Este efeito é chamado de efeito de interacção. Este termo permite que as variáveis de entrada para ter um efeito interactiva ou combinada sobre o resultado Y. Mais uma vez, a magnitude e a direcção do efeito de interacção são capturados no # 946-12 coeficiente.
# 949-, representando este prazo para toda a variação aleatória que os outros termos não pode explicar. # 949- é uma distribuição normal com o seu centro no zero.
A equação para a regressão linear múltipla pode caber muito mais que um simples de linha pode acomodar curvas, superfícies tridimensionais e relacionamentos, mesmo abstratas em n-dimensional do espaço! regressão linear múltipla pode lidar com qualquer coisa que você jogue com ele. O processo para a realização de regressão linear múltipla segue o mesmo padrão que a regressão linear simples faz:
Reunir os dados para o xs e o Y.
Estimar os vários coeficientes de regressão linear.
Quando você tem mais de um x variáveis, as equações para derivar o # 946-S-se muito complexa e muito tedioso. Você definitivamente quer usar uma ferramenta de software de análise estatística para calcular estas equações automaticamente para você. o # 946-S apenas pop direita para fora. Caso contrário, vá comprar uma caixa de número 2 lápis e arregaçar as mangas!
Verifique os valores residuais para confirmar que cumprem os pressupostos iniciais do modelo de regressão linear múltipla.
Verificando que os resíduos são normais é extremamente importante. Se a variação dos resíduos não está centrada no zero e a variação não é aleatória e normal, os pressupostos de partida do modelo de regressão linear múltipla não foram cumpridos, eo modelo é inválido.
Realizar testes estatísticos para ver quais os termos de vários termos da equação de regressão linear são significativos (e deve ser mantida no modelo) e que são insignificantes (e precisa ser removido).
Alguns termos da equação de regressão múltipla não são significativos. Você descobrir quais realizando uma F teste para cada termo da equação. Quando a contribuição variação de um termo equação é pequeno quando comparado com a variação residual, esse termo não vai passar o F testar, e você pode removê-lo a partir da equação.
O seu objectivo é o de simplificar a equação de regressão, tanto quanto possível, enquanto maximiza o R2 métrica de ajuste. Geralmente, mais simples é sempre melhor. Então, se você encontrar duas equações de regressão que ambos têm o mesmo R2 valor, você quer resolver sobre o com os termos menor número, mais simples.
Normalmente, os termos de ordem superior são os primeiros a ir. Há apenas menos chance de um termo quadrado ou um termo de interação estatisticamente significativa.
Calcular o coeficiente final da determinação R2 para o modelo de regressão linear múltipla.
Use o R2 métrica para quantificar quanto da variação observada a sua equação final explica.
Com um bom software de análise de tornar-se mais acessível, o poder de regressão linear múltipla está disponível para uma audiência crescente. Muitas ferramentas mais sofisticadas de software de análise estatística algoritmos até ter automatizados que pesquisar as várias combinações de termos de equação enquanto maximiza R2.