Como calcular correlações de dados em R

A quantidade em que duas variáveis ​​de dados variam em conjunto pode ser descrito pela coeficiente de correlação. Em R, você obtém as correlações entre um conjunto de variáveis ​​muito facilmente usando a CR () função. Basta adicionar as duas variáveis ​​que você deseja examinar como os argumentos. Por exemplo, se você quiser verificar o quanto a largura pétala se correlaciona com o comprimento pétala, você simplesmente faça o seguinte:

> Com (íris, cor (Petal.Width, Petal.Length)) [1] 0.9628654

Isto diz-lhe que a relação entre a largura eo comprimento pétala pétala é quase uma linha perfeita, como você também pode ver na quarta parcela da terceira fila.

Você também pode calcular a correlação entre as variáveis ​​múltiplas ao mesmo tempo, muito da mesma forma que você pode traçar as relações entre múltiplas variáveis. Assim, por exemplo, você pode calcular as correlações que correspondem com o enredo com a seguinte linha:

> iris.cor lt; - COR (íris [-5])

Como sempre, você pode salvar o resultado desta função em um objeto. Isso permite que você examinar a estrutura da saída da função para que você possa descobrir como você pode usá-lo no resto do seu código. Aqui está uma olhada na estrutura do objeto iris.cor:

> Str (iris.cor) Num [1: 4, 1: 4] 1 -0,118 0,872 0,818 -0,118 ...- attr (*, "dimnames") = Lista de 2 .. $: chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" .. $: chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width"

Esta saída diz que iris.cor é uma matriz com os nomes das variáveis ​​como ambos os nomes de linha e nomes de coluna. Para encontrar a correlação de duas variáveis, em que a matriz, você pode usar os nomes como índices - por exemplo:

> Iris.cor [ 'Petal.Width', 'Petal.Length'] [1] 0,9628654

menu