Como calcular a correlação
Pode uma medida estatística tanto a força ea direção de uma relação linear entre duas variáveis? Certo! Os estatísticos usar o coeficiente de correlação para medir a força ea direção da relação linear entre duas variáveis numéricas x e Y. O coeficiente de correlação para uma amostra de dados é designado por r.
Embora a definição de rua de correlação aplica-se a quaisquer dois itens que estão relacionados (tais como sexo e filiação política), estatísticos usar esse termo apenas no contexto de duas variáveis numéricas. O termo formal para a correlação é a coeficiente de correlação. Muitas medidas diferentes de correlação foram Criado- o utilizado neste caso é chamado de coeficiente de correlação de Pearson.
A fórmula para a correlação (r) é
Onde n é o número de pares de dados;
são os meios amostra de todas as x-e todos os valores y-valores, respectivamente-e sx e sy são os desvios padrão da amostra de todo o x- e y-valores, respectivamente.
Você pode usar as seguintes etapas para calcular a correlação, R, a partir de um conjunto de dados:
Localizar a média de todos os x-valores
Encontrar o desvio padrão de todos os x-valores (chamá-lo sx) E o desvio padrão de todos os y-valores (chamá-lo sy).
Por exemplo, para encontrar sx, você usaria a seguinte equação:
Para cada um dos n pares (x, y) No conjunto de dados, tomar
Junte-se o n resultados da Etapa 3.
Divida a soma por sx # 8727- sy.
Divida o resultado por n - 1, onde n é o número de (x, ypares). (É o mesmo que multiplicar por 1 mais n - 1.)
Isto dá-lhe a correlação, r.
Por exemplo, suponha que você tenha o conjunto de dados (3, 2), (3, 3) e (6, 4). Você calcular o coeficiente de correlação r através dos seguintes passos. (Note-se que para esses dados a x-Os valores são 3, 3, 6, e o y-Os valores são 2, 3, 4.)
Calculando a média dos valores X e Y, você começa
Os desvios padrão são sx = 1,73 e sy = 1,00.
o n = 3 diferenças encontradas no Passo 2 multiplicados em conjunto são: (3-4) (2-3) = (- 1) (- 1) + = 1- (3 - 4) (3 - 3) = (- 1) ( 0) = 0- (6-4) (4-3) = (2) (1) = 2.
adicionando o n = 3 Etapa 3 resultados, você tem 1 + 0 + 2 = 3.
dividindo por sx # 8727- sy dá-lhe 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (É apenas uma coincidência que o resultado da Etapa 5 também é 1.73.)
Agora dividir o resultado Passo 5 por 3 - 1 (que é 2), e você começa a correlação r = 0,87.