Como combinar e mesclar conjuntos de dados em R

Você pode querer combinar dados de diferentes fontes em sua análise. De um modo geral, você pode usar R combinar diferentes conjuntos de dados de três maneiras:

  • Ao adicionar colunas: Se os dois conjuntos de dados tem um conjunto igual de linhas, ea ordem das linhas é idêntica, colunas, em seguida, adicionando faz sentido. Suas opções para fazer isso são quadro de dados ou cbind ().

  • Ao adicionar linhas: Se ambos os conjuntos de dados têm as mesmas colunas e você quiser adicionar linhas para o fundo, o uso rbind ().

  • Ao combinar os dados com diferentes formas: o merge () função combina os dados baseados em colunas comuns, bem como linhas comuns. Em linguagem bancos de dados, este é geralmente chamado juntando dados.

Você usa merge () para encontrar o cruzamento, bem como a união, de diferentes conjuntos de dados. Você também olhar para outras formas de trabalhar com tabelas de pesquisa, usando as funções partida() e %dentro%.

image0.jpg

Às vezes você quer combinar dados onde não é tão simples simplesmente adicionar colunas ou linhas. Pode ser que você quiser combinar os dados com base nos valores da preexistentes chaves nos dados. Isto é onde a merge () função é útil. Você pode usar merge () para combinar dados somente quando certas condições correspondentes estão satisfeitos.

Digamos, por exemplo, você tem informações sobre os estados de um país. Se um conjunto de dados contém informações sobre população e outro contém informações sobre as regiões, e ambos têm informações sobre o nome do estado, você pode usar merge () para combinar os resultados.

menu