Como calcular a correlação

Pode uma medida estatística tanto a força ea direção de uma relação linear entre duas variáveis? Certo! Os estatísticos usar o coeficiente de correlação para medir a força ea direção da relação linear entre duas variáveis ​​numéricas x e Y. O coeficiente de correlação para uma amostra de dados é designado por r.

Embora a definição de rua de correlação aplica-se a quaisquer dois itens que estão relacionados (tais como sexo e filiação política), estatísticos usar esse termo apenas no contexto de duas variáveis ​​numéricas. O termo formal para a correlação é a coeficiente de correlação. Muitas medidas diferentes de correlação foram Criado- o utilizado neste caso é chamado de coeficiente de correlação de Pearson.

A fórmula para a correlação (r) é

image0.png

Onde n é o número de pares de dados;

image1.png

são os meios amostra de todas as x-e todos os valores y-valores, respectivamente-e sx e sy são os desvios padrão da amostra de todo o x- e y-valores, respectivamente.

Você pode usar as seguintes etapas para calcular a correlação, R, a partir de um conjunto de dados:

  1. Localizar a média de todos os x-valores

    image2.png
  2. Encontrar o desvio padrão de todos os x-valores (chamá-lo sx) E o desvio padrão de todos os y-valores (chamá-lo sy).

    Por exemplo, para encontrar sx, você usaria a seguinte equação:

    image3.png
  3. Para cada um dos n pares (x, y) No conjunto de dados, tomar

    image4.png
  4. Junte-se o n resultados da Etapa 3.

  5. Divida a soma por sx # 8727- sy.

  6. Divida o resultado por n - 1, onde n é o número de (x, ypares). (É o mesmo que multiplicar por 1 mais n - 1.)

    Isto dá-lhe a correlação, r.

Por exemplo, suponha que você tenha o conjunto de dados (3, 2), (3, 3) e (6, 4). Você calcular o coeficiente de correlação r através dos seguintes passos. (Note-se que para esses dados a x-Os valores são 3, 3, 6, e o y-Os valores são 2, 3, 4.)

  1. Calculando a média dos valores X e Y, você começa

    image5.png
  2. Os desvios padrão são sx = 1,73 e sy = 1,00.

  3. o n = 3 diferenças encontradas no Passo 2 multiplicados em conjunto são: (3-4) (2-3) = (- 1) (- 1) + = 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6-4) (4-3) = (2) (1) = 2.

  4. adicionando o n = 3 Etapa 3 resultados, você tem 1 + 0 + 2 = 3.

  5. dividindo por sx # 8727- sy dá-lhe 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (É apenas uma coincidência que o resultado da Etapa 5 também é 1.73.)

  6. Agora dividir o resultado Passo 5 por 3 - 1 (que é 2), e você começa a correlação r = 0,87.

menu