Como trabalhar com não-CSV arquivos de dados no R
Apesar do fato de que (valores separados por vírgula) arquivos CSV são amplamente utilizados para importar e exportar dados em R, eles nem sempre são a forma mais adequada. Alguns formatos de dados permitem a especificação de dados que não são tabulares na natureza. Outros formatos de dados permitem a descrição dos dados usando metadados (Dados que descrevem os dados).
A distribuição base de R inclui um pacote chamado estrangeiro que contém funções para importar arquivos de dados a partir de um número de pacotes estatísticos comerciais, incluindo SPSS, Stata, SAS, Octave, e Minitab.
Para usar essas funções, primeiro você tem que carregar o estrangeiro pacote:
> Biblioteca (estrangeira)> read.spss (file = "localização / do / myfile")
Sistema | Função de importar para R |
---|---|
SPSS | read.spss |
SAS | read.xport ou read.ssd |
Stata | read.dta |
Minitab | read.mtp |
Leia a documentação de ajuda sobre estas funções cuidadosamente. Porque quadros de dados em R pode ter uma estrutura completamente diferente do que conjuntos de dados nos pacotes estatísticos, você tem que prestar especial atenção à forma como valor e rótulos de variáveis são tratados por essas funções. Verifique também o tratamento de valores ausentes especiais.
Estas funções precisam de um formato de arquivo específico. A função read.xport () só funciona com o formato XPORT do SAS. Para read.mtp (), o arquivo deve estar na planilha portátil Minitab (.mtp) Formato.
Note-se que algumas destas funções são antigos. As versões mais recentes dos pacotes estatísticos mencionados aqui podem ter especificações diferentes para o formato, de modo que as funções não são sempre garantido que funcione.
Finalmente, note que algumas destas funções exigem que o pacote estatístico-se a ser instalado em seu computador. o read.ssd () função, por exemplo, só pode funcionar se tiver SAS instalado.
A linha inferior: Se você pode transferir dados usando arquivos CSV, você vai salvar um monte de problemas.
Finalmente, se você tem uma necessidade para conectar R para um banco de dados, então as chances são de que um pacote existe que pode se conectar ao seu banco de dados de escolha. Veja o quadro nas proximidades, # 147 Trabalhando com bancos de dados em R, # 148- para algumas indicações.