Como determinar uma estrutura de dados no R
A primeira decisão que você tem que fazer antes de analisar seus dados é como representar que os dados dentro R. Se os dados tem apenas uma dimensão, então você já sabe que os vetores representam este tipo de dados muito bem. No entanto, se os seus dados tem mais de uma dimensão, você tem a opção de usar matrizes, listas ou quadros de dados. Assim, a pergunta é: Quando você usa o que?
As matrizes e matrizes de dimensão superior são úteis quando todos os seus dados são de uma única classe - em outras palavras, todos os seus dados são numéricos ou todos os seus dados são personagens. Se você é um matemático ou um estatístico, você está familiarizado com matrizes e provavelmente usar esse tipo de objeto muito frequentemente.
Mas, em muitas situações práticas, você terá dados que têm muitas classes diferentes - em outras palavras, você terá uma mistura de dados numéricos e de caracteres. Neste caso, você precisa usar tanto listas ou quadros de dados.
Se você imaginar seus dados como uma única planilha, um quadro de dados é provavelmente uma boa escolha. Lembre-se que um quadro de dados é simplesmente uma lista de vetores com o nome do mesmo comprimento, que é conceitualmente muito semelhante a uma planilha com colunas e um título de coluna para cada um.
Se você estiver familiarizado com bancos de dados, você pode pensar em um quadro de dados como semelhante a uma única tabela em um banco de dados. Os quadros de dados são extremamente úteis e, em muitos casos, será a sua primeira escolha de objetos para armazenar seus dados.
Se os seus dados consiste de uma coleção de objetos, mas você não pode representar que, como uma matriz ou um quadro de dados, em seguida, uma lista é a sua escolha ideal. Como as listas podem conter todos os tipos de outros objetos, incluindo outras listas ou quadros de dados, eles são tremendamente flexível. Por conseguinte, R tem uma grande variedade de ferramentas para processar listas.
Você pode achar que um quadro de dados é uma escolha muito adequada para a maioria das tarefas de análise e processamento de dados. É uma maneira muito conveniente de representar os seus dados, e é semelhante a trabalhar com tabelas de banco de dados. Quando você ler dados de um valor separados por vírgulas (CSV) com a função read.csv () ou read.table (), R coloca os resultados em um quadro de dados.
Objeto | Descrição | Comentários |
---|---|---|
vetor | O objeto de dados básico em R, que consiste em um ou mais valores OFA único tipo (por exemplo, caracteres, número ou inteiro). | Pense nisso como uma única coluna ou linha em uma planilha, ou acolumn em uma tabela de banco de dados. |
matriz ou matriz | Um objecto multidimensional de um único tipo (conhecido comoatômico). Uma matriz é uma matriz de duas dimensões. | Quando você tem que armazenar números em muitas dimensões, usearrays. |
Lista | As listas podem conter objetos de qualquer tipo. | As listas são muito úteis para armazenar conjuntos de dados em conjunto thatbelong. Porque as listas podem conter listas, este tipo ofobject é muito útil. |
quadro de dados | Os quadros de dados são de um tipo especial de chamada lista onde todos theelements têm o mesmo comprimento. | Os quadros de dados são semelhantes aos de uma única folha de cálculo ou a uma tablein um banco de dados. |