Como lidar com valores de dados perdidos em R

o CR () função em R pode lidar com valores de dados perdidos de várias maneiras. Para isso, você definir o argumento usar a um dos possíveis valores de texto. O valor para a usar argumento é especialmente importante se você calcular as correlações das variáveis ​​em um quadro de dados. Ao definir este argumento para valores diferentes, você pode

  • Use todas as observações, definindo use = "tudo". Isto significa que se houver qualquer N / D valor de uma das variáveis, a correlação resultante é N / D também. Este é o padrão.

  • Excluir todas as observações que têm N / D para, pelo menos, uma variável. Para isso, você definir usar = 'complete.obs'. Observe que isso pode deixá-lo com apenas algumas observações, se os valores em falta são espalhados através do conjunto de dados completo.

  • Excluir observações com N / D valores para cada par de variáveis ​​que você examinar. Para isso, você definir o argumento usar = 'pares'. Isso garante que você pode calcular a correlação para cada par de variáveis ​​sem perda de informação por causa dos valores em falta nas outras variáveis.

Na verdade, você pode calcular diferentes medidas de correlação. Por padrão, R calcula o coeficiente de correlação de Pearson padrão. Para dados que não são normalmente distribuídos, você pode usar o CR () função para calcular o grau de correlação de Spearman, ou tau de Kendall. Para isso, você tem que definir o método argumento para o valor apropriado.

menu