Como calcular uma linha de regressão
Nas estatísticas, é possível calcular uma linha de regressão para duas variáveis se a sua dispersão mostra um padrão linear ea correlação entre as variáveis é muito forte (por exemplo, r
Menu
A fórmula para o linha de melhor ajuste (ou linha de regressão) é y = mx + b, Onde m é o declive da linha e b é o y-interceptar. Esta equação em si é o mesmo usado para encontrar uma linha no algebra- mas lembre-se, nas estatísticas os pontos não mentem perfeitamente em uma linha - a linha é um modelo em torno do qual os dados se encontram, se existe um padrão linear forte.
o declive de uma linha é a mudança de Y através da alteração da x. Por exemplo, uma inclinação de
significa que o x-acréscimos de valor (Move para a direita) por 3 unidades, o y-valor move-se por 10 unidades, em média.
o intercepção y é o valor no eixo dos Y, em que a linha atravessa. Por exemplo, na equação y = 2x - 6, a linha atravessa o y-eixo com o valor b = -6. As coordenadas deste ponto são (0, -6) - quando uma linha cruza a y-eixo, o x-valor é sempre 0.
Você pode estar pensando que você tem que tentar muitas e muitas linhas diferentes para ver qual deles se encaixa melhor. Felizmente, você tem uma opção mais simples (embora eyeballing uma linha no gráfico de dispersão faz ajudá-lo a pensar sobre o que seria de esperar a resposta a ser). A linha de melhor encaixe tem uma inclinação distinta e y-intercepção que pode ser calculada usando as fórmulas (e essas fórmulas não são muito difíceis de calcular).
Para salvar uma grande quantidade de tempo calculando a melhor linha de montagem, primeiro encontrar o # 147-cinco grandes, # 148- cinco estatísticas de resumo que você precisa em seus cálculos:
A média do x valores
A média do y valores
O desvio padrão do x valores (denotado sx)
O desvio padrão do y valores (denotado sy)
A correlação entre x e Y (denotado r)
Encontrar a inclinação de uma linha de regressão
A fórmula para a inclinação, m, da linha de melhor ajuste é
Onde r é a correlação entre x e Y, e sx e sy são os desvios-padrão da x-valores e o y-valores, respectivamente. Você simplesmente dividir syde sx e multiplicar o resultado por r.
Note-se que a inclinação da linha de melhor ajuste pode ser um número negativo, porque a correlação pode ser um número negativo. A inclinação negativa indica que a linha está indo ladeira abaixo. Por exemplo, se um aumento na policiais está relacionada com uma diminuição no número de crimes em um moda- linear, em seguida, a correlação e, portanto, a inclinação da linha de melhor encaixe é negativo no caso presente.
A correlação ea inclinação da linha de melhor ajuste não são os mesmos. A fórmula para o declive leva a correlação (uma medição sem unidade) e atribui unidades a ele. Imagine sy dividido por sx como a variação (semelhante a mudança) em Y através da variação X, em unidades de x e Y. Por exemplo, variação de temperatura (graus Celsius) através da variação no número de grilos (em 15 segundos).
Encontrar a intercepção y de uma linha de regressão
A fórmula para o y-interceptar, b, da linha de melhor ajuste é
são os meios da x-valores e o y-valores, respectivamente, e m é o declive.
Assim, para calcular o y-interceptar, b, da linha de melhor ajuste, você começar por encontrar o declive, m, da linha de melhor ajuste usando as etapas acima. Em seguida, para encontrar o y-interceptar, você multiplicar m de
Sempre calcular a inclinação antes do y-interceptar. A fórmula para o y-interceptação contém a inclinação!