Como calcular correlações de dados em R
A quantidade em que duas variáveis de dados variam em conjunto pode ser descrito pela coeficiente de correlação. Em R, você obtém as correlações entre um conjunto de variáveis muito facilmente usando a CR () função. Basta adicionar as duas variáveis que você deseja examinar como os argumentos. Por exemplo, se você quiser verificar o quanto a largura pétala se correlaciona com o comprimento pétala, você simplesmente faça o seguinte:
> Com (íris, cor (Petal.Width, Petal.Length)) [1] 0.9628654
Isto diz-lhe que a relação entre a largura eo comprimento pétala pétala é quase uma linha perfeita, como você também pode ver na quarta parcela da terceira fila.
Você também pode calcular a correlação entre as variáveis múltiplas ao mesmo tempo, muito da mesma forma que você pode traçar as relações entre múltiplas variáveis. Assim, por exemplo, você pode calcular as correlações que correspondem com o enredo com a seguinte linha:
> iris.cor lt; - COR (íris [-5])
Como sempre, você pode salvar o resultado desta função em um objeto. Isso permite que você examinar a estrutura da saída da função para que você possa descobrir como você pode usá-lo no resto do seu código. Aqui está uma olhada na estrutura do objeto iris.cor:
> Str (iris.cor) Num [1: 4, 1: 4] 1 -0,118 0,872 0,818 -0,118 ...- attr (*, "dimnames") = Lista de 2 .. $: chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" .. $: chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width"
Esta saída diz que iris.cor é uma matriz com os nomes das variáveis como ambos os nomes de linha e nomes de coluna. Para encontrar a correlação de duas variáveis, em que a matriz, você pode usar os nomes como índices - por exemplo:
> Iris.cor [ 'Petal.Width', 'Petal.Length'] [1] 0,9628654