Diferentes Abordagens para Análise de Dados Big

Em muitos casos, a análise de dados grande será representado para o usuário final por meio de relatórios e visualizações. Porque os dados brutos pode ser incomprehensively variada, você terá que contar com ferramentas e técnicas de análise para ajudar a apresentar os dados de maneira significativa.

Novas aplicações estão chegando disponível e vai cair amplamente em duas categorias: custom ou semi-custom.

aplicações personalizadas para análise de dados grande

Em geral, um aplicativo personalizado é criado para uma finalidade específica ou um conjunto relacionado de propósitos. Para análise dos dados grande, o propósito de desenvolvimento de aplicações customizadas é acelerar o tempo para decisão ou ação.

ambiente: R

o # 147-R # 148- ambiente baseia-se na # 147-S # 148- estatísticas e linguagem análise desenvolvida na década de 1990 por Bell Laboratories. Ele é mantido pelo projeto GNU e está disponível sob a licença GNU.

Embora difícil de compreender plenamente, a sua profundidade e flexibilidade torná-lo uma opção atraente para desenvolvedores de aplicativos de análise e # usuários 147-potência. # 148- Além disso, o projeto CRAN R mantém um conjunto mundial de servidores web com as versões mais up-to-date do ambiente R File Transfer Protocol e. A comercialmente suportado, versão da empresa de R também está disponível Revolution Analytics.

Mais especificamente, R é um conjunto integrado de ferramentas de software e tecnologias destinadas a criar aplicativos personalizados usados ​​para facilitar a manipulação de dados, cálculo, análise e apresentação visual. Entre outros recursos avançados, ele suporta

  • -Manipulação de dados e manipulação de componentes eficazes.

  • Operadores de cálculos sobre matrizes e outros tipos de dados solicitados.

  • Ferramentas específicas para uma ampla variedade de análises de dados.

  • capacidades avançadas de visualização.

  • linguagem de programação S projetado por programadores, para programadores com muitas construções familiares, incluindo condicionais, loops, funções recursivas definidas pelo usuário, e uma ampla gama de recursos de entrada e saída.

R é bem adequado para uso único, aplicativos personalizados para a análise de fontes de dados grandes.

Google API de Previsão

API de Previsão da Google é um exemplo de uma classe emergente de grandes ferramentas de aplicação de análise de dados. Ele está disponível no site do Google desenvolvedores e está bem documentado e equipados com vários mecanismos de acesso, utilizando diferentes linguagens de programação. Para ajudar você a começar, ele está disponível gratuitamente por seis meses.

A API de Previsão é bastante simples. Ele procura por padrões e combina-os a padrões prescritiva, prescritivos, ou outras existentes. Durante a execução de seu casamento de padrões, também # 147-aprende. # 148- Quanto mais você usá-lo, o mais esperto ele fica.

Previsão é implementada como uma API RESTful com suporte de idioma para .NET, Java, PHP, javascript, Python, Ruby, e muitos outros. O Google também fornece scripts para acessar a API, bem como uma biblioteca cliente para R.

análise preditiva é uma das mais poderosas capacidades potenciais de dados grandes e API de Previsão da Google é uma ferramenta muito útil para a criação de aplicações personalizadas.

aplicações semi-personalizadas para análise de dados grande

Na verdade, o que muitas pessoas percebem como aplicativos personalizados são realmente criado usando # 147-embalados # 148- ou componentes de terceiros, como bibliotecas. Nem sempre é necessário para codificar completamente uma nova aplicação. Usando aplicativos ou componentes embalados requer que os desenvolvedores ou analistas de escrever código para # 147 unidos # 148- esses componentes em uma aplicação personalizada de trabalho. A seguir, são razões pelas quais esta é uma boa abordagem:

  • Velocidade de implantação: Porque você não tem que escrever cada parte do aplicativo, o tempo de desenvolvimento pode ser bastante reduzido.

  • Estabilidade: Usando bem construídos, confiáveis ​​e componentes de terceiros pode ajudar a tornar o aplicativo personalizado mais resistente.

  • Melhor qualidade: componentes embalados são frequentemente sujeitos a padrões mais elevados de qualidade, porque eles são implantados em uma grande variedade de ambientes e domínios.

  • Mais flexibilidade: Se um componente melhor aparecer, pode ser trocado no aplicativo, estendendo o tempo de vida, adaptabilidade e utilidade do aplicativo personalizado.

Outro tipo de aplicação semi-custom é aquele em que o código fonte está disponível e é modificado para um propósito particular. Esta pode ser uma abordagem eficiente porque há muito poucos exemplos de blocos de construção de aplicação disponível para incorporar em sua aplicação semi-personalizado:

  • TA-Lib: A biblioteca de análise técnica é amplamente utilizado por desenvolvedores de software que precisam para realizar a análise técnica dos dados do mercado financeiro. Ele está disponível como código aberto sob a licença BSD, que lhe permite ser integrada nas aplicações semi-personalizadas.

  • JUNG: O framework Java Universal Gráfico de Rede é uma biblioteca que fornece um quadro comum para análise e visualização de dados que pode ser representado por um gráfico ou rede. É útil para análise de redes sociais, as medidas de importância, e mineração de dados. Ele está disponível como código aberto sob a licença BSD.

  • GeoTools: Um kit de ferramentas geoespacial open source para a manipulação de dados GIS em muitas formas, analisando atributos espaciais e não-espaciais ou dados GIS e criação de gráficos e redes de dados. Ele está disponível sob a licença GPL2, permitindo a integração em aplicações semi-personalizadas.

menu