Use gráficos de dispersão para identificar uma relação linear na análise de regressão simples
UMA gráfico de dispersão é um tipo especial de gráfico desenhado para mostrar a relação entre as duas variáveis. Com a análise de regressão, você pode usar um gráfico de dispersão para inspecionar visualmente os dados para ver se x e Y são linearmente relacionadas. A seguir estão alguns exemplos.
Esta figura mostra um gráfico de dispersão de duas variáveis que têm uma relação não linear entre eles.
Cada ponto no gráfico representa um único (x, Y) Par. Porque o gráfico não é uma linha reta, a relação entre x e Y é não linear. Observe que começando com os valores mais negativos de x, Como x aumenta, Y em primeiro lugar, em seguida, como decreases- x continua a aumentar, Y aumenta. O gráfico mostra claramente que a inclinação é continuamente changing- não é uma constante. Com uma relação linear, a inclinação nunca muda.
Neste exemplo, um dos pressupostos fundamentais da análise de regressão simples é violada, e você precisa de uma outra abordagem para estimar a relação entre x e Y. Uma possibilidade é transformar o variables- por exemplo, você pode executar uma regressão simples entre ln (x) E ln (Y). ( "Ln" representa o logaritmo natural.) Isso muitas vezes ajuda a eliminar não-linearidades na relação entre x e Y. Outra possibilidade é usar um tipo mais avançado de análise de regressão, que pode incorporar relações não lineares.
Esta figura mostra um gráfico de dispersão de duas variáveis que têm uma relação linear fortemente positiva entre eles. A correlação entre x e Y é igual a 0,9.
A figura mostra uma tendência muito forte para x e Y tanto para aumento acima das suas possibilidades ou cair abaixo de suas possibilidades, ao mesmo tempo. A linha reta é uma linha de tendência, projetado para chegar o mais perto possível para todos os pontos de dados. A linha de tendência tem uma inclinação positiva, o que mostra uma relação positiva entre x e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre x e Y. (Nota: A inclinação da linha não é 0.9- 0.9 é a correlação entre x e Y.)
A figura a seguir mostra um gráfico de dispersão de duas variáveis que têm uma relação linear fracamente positiva entre eles- a correlação entre x e Y é igual a 0,2.
Esta figura mostra uma ligação mais fraca entre x e Y. Note-se que os pontos no gráfico são mais espalhadas sobre a linha de tendência do que na figura anterior, devido à relação mais fraca entre x e Y.
A figura a seguir é um gráfico de dispersão de duas variáveis que têm uma relação linear fortemente negativa entre eles- a correlação entre x e Y é igual a -0,9.
Esta figura mostra uma tendência muito forte para x e Y mover-se em direções- oposta por exemplo, eles sobem acima ou cair abaixo de seus meios, por vezes, opostas. A linha de tendência tem uma inclinação negativa, o que mostra uma relação negativa entre x e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre x e Y.
A figura a seguir é um gráfico de dispersão de duas variáveis que têm uma relação linear negativa fraca entre eles. A correlação entre x e Y é igual a -0,2.
Esta figura mostra uma ligação muito fraca entre x e Y. Note-se que os pontos no gráfico são mais espalhadas sobre a linha de tendência do que na figura anterior, devido à relação mais fraca entre x e Y.