Diferentes Abordagens para Análise de Dados Big
Em muitos casos, a análise de dados grande será representado para o usuário final por meio de relatórios e visualizações. Porque os dados brutos pode ser incomprehensively variada, você terá que contar com ferramentas e técnicas de análise para ajudar a apresentar os dados de maneira significativa.
Menu
Novas aplicações estão chegando disponível e vai cair amplamente em duas categorias: custom ou semi-custom.
aplicações personalizadas para análise de dados grande
Em geral, um aplicativo personalizado é criado para uma finalidade específica ou um conjunto relacionado de propósitos. Para análise dos dados grande, o propósito de desenvolvimento de aplicações customizadas é acelerar o tempo para decisão ou ação.
ambiente: R
o # 147-R # 148- ambiente baseia-se na # 147-S # 148- estatísticas e linguagem análise desenvolvida na década de 1990 por Bell Laboratories. Ele é mantido pelo projeto GNU e está disponível sob a licença GNU.
Embora difícil de compreender plenamente, a sua profundidade e flexibilidade torná-lo uma opção atraente para desenvolvedores de aplicativos de análise e # usuários 147-potência. # 148- Além disso, o projeto CRAN R mantém um conjunto mundial de servidores web com as versões mais up-to-date do ambiente R File Transfer Protocol e. A comercialmente suportado, versão da empresa de R também está disponível Revolution Analytics.
Mais especificamente, R é um conjunto integrado de ferramentas de software e tecnologias destinadas a criar aplicativos personalizados usados para facilitar a manipulação de dados, cálculo, análise e apresentação visual. Entre outros recursos avançados, ele suporta
-Manipulação de dados e manipulação de componentes eficazes.
Operadores de cálculos sobre matrizes e outros tipos de dados solicitados.
Ferramentas específicas para uma ampla variedade de análises de dados.
capacidades avançadas de visualização.
linguagem de programação S projetado por programadores, para programadores com muitas construções familiares, incluindo condicionais, loops, funções recursivas definidas pelo usuário, e uma ampla gama de recursos de entrada e saída.
R é bem adequado para uso único, aplicativos personalizados para a análise de fontes de dados grandes.
Google API de Previsão
API de Previsão da Google é um exemplo de uma classe emergente de grandes ferramentas de aplicação de análise de dados. Ele está disponível no site do Google desenvolvedores e está bem documentado e equipados com vários mecanismos de acesso, utilizando diferentes linguagens de programação. Para ajudar você a começar, ele está disponível gratuitamente por seis meses.
A API de Previsão é bastante simples. Ele procura por padrões e combina-os a padrões prescritiva, prescritivos, ou outras existentes. Durante a execução de seu casamento de padrões, também # 147-aprende. # 148- Quanto mais você usá-lo, o mais esperto ele fica.
Previsão é implementada como uma API RESTful com suporte de idioma para .NET, Java, PHP, javascript, Python, Ruby, e muitos outros. O Google também fornece scripts para acessar a API, bem como uma biblioteca cliente para R.
análise preditiva é uma das mais poderosas capacidades potenciais de dados grandes e API de Previsão da Google é uma ferramenta muito útil para a criação de aplicações personalizadas.
aplicações semi-personalizadas para análise de dados grande
Na verdade, o que muitas pessoas percebem como aplicativos personalizados são realmente criado usando # 147-embalados # 148- ou componentes de terceiros, como bibliotecas. Nem sempre é necessário para codificar completamente uma nova aplicação. Usando aplicativos ou componentes embalados requer que os desenvolvedores ou analistas de escrever código para # 147 unidos # 148- esses componentes em uma aplicação personalizada de trabalho. A seguir, são razões pelas quais esta é uma boa abordagem:
Velocidade de implantação: Porque você não tem que escrever cada parte do aplicativo, o tempo de desenvolvimento pode ser bastante reduzido.
Estabilidade: Usando bem construídos, confiáveis e componentes de terceiros pode ajudar a tornar o aplicativo personalizado mais resistente.
Melhor qualidade: componentes embalados são frequentemente sujeitos a padrões mais elevados de qualidade, porque eles são implantados em uma grande variedade de ambientes e domínios.
Mais flexibilidade: Se um componente melhor aparecer, pode ser trocado no aplicativo, estendendo o tempo de vida, adaptabilidade e utilidade do aplicativo personalizado.
Outro tipo de aplicação semi-custom é aquele em que o código fonte está disponível e é modificado para um propósito particular. Esta pode ser uma abordagem eficiente porque há muito poucos exemplos de blocos de construção de aplicação disponível para incorporar em sua aplicação semi-personalizado:
TA-Lib: A biblioteca de análise técnica é amplamente utilizado por desenvolvedores de software que precisam para realizar a análise técnica dos dados do mercado financeiro. Ele está disponível como código aberto sob a licença BSD, que lhe permite ser integrada nas aplicações semi-personalizadas.
JUNG: O framework Java Universal Gráfico de Rede é uma biblioteca que fornece um quadro comum para análise e visualização de dados que pode ser representado por um gráfico ou rede. É útil para análise de redes sociais, as medidas de importância, e mineração de dados. Ele está disponível como código aberto sob a licença BSD.
GeoTools: Um kit de ferramentas geoespacial open source para a manipulação de dados GIS em muitas formas, analisando atributos espaciais e não-espaciais ou dados GIS e criação de gráficos e redes de dados. Ele está disponível sob a licença GPL2, permitindo a integração em aplicações semi-personalizadas.