Use gráficos de dispersão para identificar uma relação linear na análise de regressão simples

UMA gráfico de dispersão é um tipo especial de gráfico desenhado para mostrar a relação entre as duas variáveis. Com a análise de regressão, você pode usar um gráfico de dispersão para inspecionar visualmente os dados para ver se x e Y são linearmente relacionadas. A seguir estão alguns exemplos.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação não linear entre eles.

gráfico de dispersão de uma relação não-linear.
gráfico de dispersão de uma relação não-linear.

Cada ponto no gráfico representa um único (x, Y) Par. Porque o gráfico não é uma linha reta, a relação entre x e Y é não linear. Observe que começando com os valores mais negativos de x, Como x aumenta, Y em primeiro lugar, em seguida, como decreases- x continua a aumentar, Y aumenta. O gráfico mostra claramente que a inclinação é continuamente changing- não é uma constante. Com uma relação linear, a inclinação nunca muda.

Neste exemplo, um dos pressupostos fundamentais da análise de regressão simples é violada, e você precisa de uma outra abordagem para estimar a relação entre x e Y. Uma possibilidade é transformar o variables- por exemplo, você pode executar uma regressão simples entre ln (x) E ln (Y). ( "Ln" representa o logaritmo natural.) Isso muitas vezes ajuda a eliminar não-linearidades na relação entre x e Y. Outra possibilidade é usar um tipo mais avançado de análise de regressão, que pode incorporar relações não lineares.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação linear fortemente positiva entre eles. A correlação entre x e Y é igual a 0,9.

gráfico de dispersão de uma relação linear fortemente positivo.
gráfico de dispersão de uma relação linear fortemente positivo.

A figura mostra uma tendência muito forte para x e Y tanto para aumento acima das suas possibilidades ou cair abaixo de suas possibilidades, ao mesmo tempo. A linha reta é uma linha de tendência, projetado para chegar o mais perto possível para todos os pontos de dados. A linha de tendência tem uma inclinação positiva, o que mostra uma relação positiva entre x e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre x e Y. (Nota: A inclinação da linha não é 0.9- 0.9 é a correlação entre x e Y.)

A figura a seguir mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação linear fracamente positiva entre eles- a correlação entre x e Y é igual a 0,2.

gráfico de dispersão de uma relação linear fracamente positivo.
gráfico de dispersão de uma relação linear fracamente positivo.

Esta figura mostra uma ligação mais fraca entre x e Y. Note-se que os pontos no gráfico são mais espalhadas sobre a linha de tendência do que na figura anterior, devido à relação mais fraca entre x e Y.

A figura a seguir é um gráfico de dispersão de duas variáveis ​​que têm uma relação linear fortemente negativa entre eles- a correlação entre x e Y é igual a -0,9.

gráfico de dispersão de uma relação linear fortemente negativo.
gráfico de dispersão de uma relação linear fortemente negativo.

Esta figura mostra uma tendência muito forte para x e Y mover-se em direções- oposta por exemplo, eles sobem acima ou cair abaixo de seus meios, por vezes, opostas. A linha de tendência tem uma inclinação negativa, o que mostra uma relação negativa entre x e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre x e Y.

A figura a seguir é um gráfico de dispersão de duas variáveis ​​que têm uma relação linear negativa fraca entre eles. A correlação entre x e Y é igual a -0,2.

gráfico de dispersão de uma relação linear fracamente negativo.
gráfico de dispersão de uma relação linear fracamente negativo.

Esta figura mostra uma ligação muito fraca entre x e Y. Note-se que os pontos no gráfico são mais espalhadas sobre a linha de tendência do que na figura anterior, devido à relação mais fraca entre x e Y.

menu