Noções básicas de tipos de dados e estruturas em R programação para análise preditiva

Na programação R para análise preditiva, os dados tipos

às vezes são confundidos com os dados estruturas. Cada variável na memória do programa tem um tipo de dados. Claro, você pode começar afastado com ter diversas variáveis ​​em seu programa e ainda ser administrável. Mas isso provavelmente não vai funcionar tão bem se você tem centenas (ou milhares) de variables- você tem que dar a cada variável um nome para que você possa acessá-lo.

É mais eficiente para armazenar todas essas variáveis ​​em um conjunto lógico.

Tipos de dados

Como outras linguagens de programação completa, R oferece muitos tipos de dados e estruturas de dados. Não há necessidade de especificar o tipo que você está atribuindo a um Variável o intérprete vai fazer isso por você. No entanto, você pode especificar ou converter o tipo se a necessidade arises- isso é chamado moldagem. Três tipos de dados são os seguintes:

  • Numérico: Estas são as suas típicas números decimais. Estes são chamados flutuadores (abreviatura de números de ponto flutuante) ou dupla em outras línguas.

  • Personagens: Estas são as suas cordas formados com combinações de letras, caracteres e números. Eles não são feitos para ter qualquer significado numérico. Estes são chamados cordas em outras línguas.

  • Lógico: VERDADE ou FALSO. Sempre capitalizar estes valores em R. Estes valores são chamados Booleans em outras línguas.

Comparando uma seqüência de números a uma série numérica resulta no interpretador converter a seqüência de números em uma numérica e, em seguida, fazer uma comparação numérica.

Exemplos de tipos de dados são os seguintes:

> i lt; - 10 # numérico> J lt; - 10,0 # numérico> k lt; - "10" # character> m lt; - == i j # lógico> N lt; - i == k # lógica

Depois de executar essas linhas de código, você pode descobrir seus valores e tipos usando a str () função. Essa operação se parece com isso:

> Str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi VERDADEIRO> str (n) logi VERDADE

A expressão na n atribuição é um exemplo do intérprete convertendo temporariamente o tipo de dados k em um numérico para fazer a avaliação entre numérica Eu e caráter k.

Estruturas de dados

R vai precisar de um lugar para armazenar grupos de tipos de dados, a fim de trabalhar com ele de forma eficiente. Estes são chamados estruturas de dados.

Um exemplo da vida real deste conceito é uma garagem de estacionamento: É uma estrutura que armazena automóveis eficiente. Ele foi projetado para estacionar como muitos automóveis quanto possível, e permite automóveis para entrar de forma eficiente e sair da estrutura. Além disso, há outros objetos além de automóveis deve ser estacionado em uma estrutura de estacionamento.

estruturas de dados incluem:

  • vetores: Vectores armazenar um conjunto de valores de um único tipo de dados. Pense nisso como uma casamata semanal. Cada compartimento na caixa de comprimidos só pode armazenar um certo tipo de objecto. Depois de colocar alguns comprimidos em um dos compartimentos, todos os outros compartimentos também deve ser preenchido com o zero pílulas ou mais comprimidos.

    Você não pode colocar moedas na mesma caixa- você tem que usar um diferente # 147-pill box # 148- (vetor) por isso. Da mesma forma, uma vez que você armazenar um número em um vetor, todos os valores futuros também devem ser números. Caso contrário, o intérprete converte todos os seus números de caracteres.

  • matrizes: UMA matriz se parece com uma planilha do Excel: Essencialmente é uma tabela consiste em linhas e colunas. Os dados preenche as células vazias por linha ou coluna Ordem, na qual você especifica ao criar a matriz.

    Todas as colunas devem ter o mesmo tipo de dados.

  • Os quadros de dados: Um quadro de dados é semelhante a uma matriz, excepto as colunas de uma estrutura de dados pode conter diferentes tipos de dados. Os conjuntos de dados utilizados em modelos de previsão são carregados em tramas de dados e armazenado ali para uso no modelo.

  • fatores: UMA fator é como um vector com um número limitado de valores distintos. O número de valores distintos é referido como a sua nível. É possível utilizar factores para o tratamento de uma coluna que tem um número limitado de valores e conhecido como valores categóricas. Por padrão, os dados de caracteres é carregado para os quadros de dados como fatores.

Você acessa vetores, matrizes e quadros de dados usando notação de matriz. Por exemplo, você deve digitar v [5] para acessar o quinto elemento do vector v. Para uma matriz bidimensional e quadro de dados, você colocar o número de linhas e colunas número, separadas por uma vírgula, dentro dos colchetes. Por exemplo, você digita m [2,3] para acessar a segunda linha, terceira coluna valor para a matriz m.

As estruturas de dados são um assunto avançado em ciência da computação. Por enquanto, estamos aderindo à prática. Basta lembrar que as estruturas de dados foram construídas para armazenar tipos específicos de dados e eles têm funções para inserção de dados, eliminação e recuperação.

menu