Noções básicas de R programação para análise preditiva

R é uma linguagem de programação originalmente escrito para estatísticos para fazer análise estatística, incluindo a análise preditiva. É software de código aberto, amplamente utilizado na academia para ensinar disciplinas como estatísticas, bio-informática e economia. Desde seu humilde início, que desde então tem sido estendida para fazer modelagem de dados, data mining e análise preditiva.

R tem um muito ativas contribuições de código livre comunitária estão sendo feitas constantemente e de forma consistente. Um dos benefícios do uso de uma ferramenta de código aberto, como R é que a maior parte da análise de dados que você vai querer fazer já foi feito por alguém. exemplos de código são colocadas em muitos quadros de mensagens e pelas universidades.

Se você está preso com algum código problemático, simplesmente postar uma pergunta sobre uma placa de mensagem (como pilha de troca ou pilha-overflow) e você terá uma resposta em nenhum momento.

Devido R é livre para usar, é a ferramenta perfeita para usar para construir um protótipo rápido para mostrar a gestão dos benefícios da análise preditiva. Você não tem que pedir a gestão para comprar qualquer coisa, a fim de começar imediatamente. Qualquer um dos cientistas seus dados, analistas de negócios, estatísticos, engenheiros de software ou pode fazer o protótipo, sem qualquer investimento adicional em software.

Portanto R pode ser uma maneira barata de experimentar com a análise preditiva sem ter que comprar o software da empresa. Depois de provar que a análise preditiva pode adicionar (ou está adicionando) valor, você deve ser capaz de convencer a administração a considerar a obtenção de uma ferramenta de nível comercial para sua equipe-ciência de dados recém-criado.

Como instalar R

Instalando R é um processo fácil que leva menos de trinta minutos. A maioria das configurações padrão pode ser aceite durante o processo de instalação. Você pode instalar R fazendo o download do programa de instalação para Windows e outros sistemas operacionais da website R.

Depois de chegar ao site do R, você pode olhar para downloads de conectar-se a obter o arquivo. Depois de ter baixado o arquivo, basta clicar duas vezes nele para iniciar o processo de instalação.

Como instalar rstudio

Depois de terminar o processo de instalação R, você pode instalar rstudio. Instalando o rstudio IDE é tão fácil quanto instalar R. Você pode baixar rstudio área de trabalho do seu site. Você vai querer instalar a versão desktop adequado para o seu sistema operacional (por exemplo, rstudio versão 0.97.551 para Windows). Depois de ter baixado o arquivo, basta clicar duas vezes nele para iniciar o processo de instalação.

Aqui é um link direto para sua conveniência.

Fundamentos do ambiente: R

Rstudio é uma interface gráfica para o desenvolvimento de programas de I. A interface padrão (o que parece quando você iniciar o programa) tem quatro painéis de janela. Você vai usar todos os quatro deles com frequência.

image0.jpg

  • A janela superior esquerda é a sua janela script.

    Isto é onde você pode copiar e colar o código R. Você pode executar a linha por linha de código ou em pedaços, destacando as linhas que você deseja executar. A janela de script é também onde você pode ver os valores de quadros de dados. Quando você clica em um quadro de dados do painel de espaço de trabalho, ele vai abrir uma nova aba no painel de script com os valores de estrutura de dados.

  • A janela inferior esquerdo é a sua janela console.

    Isto é onde você digita seu código R uma linha de cada vez. A saída (se houver algum) é impresso na linha seguinte para a direita após o comando termina a execução.

  • A janela superior direito é o seu espaço de trabalho e janela história.

    Ele tem duas guias:

  • A guia Histórico armazena o histórico de todo o código que você tenha executado na sessão atual.

  • A guia Workspace lista todas as variáveis ​​na memória. Aqui você pode clicar as variáveis ​​para ver seus valores e (se você preferir) conjuntos de dados de carga de forma interativa.

  • A janela inferior direita é onde você vai encontrar quatro guias de interesse:

  • A guia Ajuda oferece documentação, tais como descrições de funções.

  • A guia Pacotes mostra todos os pacotes instalados e disponíveis para carregar pelo seu programa. Os pacotes verificados são os que foram carregados para o seu programa para usar. Você pode pesquisar e instalar novos pacotes aqui.

  • A guia Plots é onde a saída de quaisquer parcelas aparecerá.

  • A guia Arquivos é o seu explorador de arquivos dentro rstudio.

  • menu