Camada 1 do Big Data Pilha: Infra-estrutura de Segurança
Segurança e privacidade requisitos, camada 1 da pilha de dados grande, são semelhantes aos requisitos de ambientes de dados convencionais. Os requisitos de segurança têm de ser estreitamente alinhados com as necessidades específicas do negócio. Alguns desafios únicos surgem quando grande dados torna-se parte da estratégia:
Data de acesso: O acesso do usuário aos dados de grandes crus ou computados tem aproximadamente o mesmo nível de requisitos técnicos como não-grandes implementações de dados. Os dados devem estar disponíveis apenas para aqueles que têm uma necessidade comercial legítima por examinar ou interagir com ele. A maioria das plataformas de armazenamento de dados centrais têm regimes de segurança rigorosos e são aumentadas com uma capacidade de identidade federada, proporcionando um acesso adequado através das muitas camadas de arquitetura.
Acesso aplicação: acesso ao aplicativo para dados também é relativamente simples do ponto de vista técnico. A maioria das interfaces de programação de aplicativos (APIs) oferecem proteção contra o uso não autorizado ou acesso. Esse nível de proteção é provavelmente adequado para a maioria das grandes implementações de dados.
Criptografia de dados: A encriptação de dados é o aspecto mais desafiador de segurança em um ambiente de dados grande. Em ambientes tradicionais, criptografar e descriptografar dados realmente salienta recursos dos sistemas. Este problema é agravado com big data. A abordagem mais simples é proporcionar mais e mais rapidamente a capacidade computacional. Uma abordagem mais temperado é identificar os elementos de dados que exigem esse nível de segurança e criptografar apenas os itens necessários.
detecção de ameaças: A inclusão de dispositivos móveis e redes sociais aumenta exponencialmente, tanto a quantidade de dados e as oportunidades para ameaças de segurança. Portanto, é importante que as organizações ter uma abordagem multiperimeter à segurança.
Então, infra-estrutura física permite tudo e infra-estrutura de segurança protege todos os elementos em seu ambiente de dados grande. O próximo nível da pilha são as interfaces que fornecem acesso bidirecional a todos os componentes da pilha - a partir de aplicativos corporativos para feeds de dados a partir da Internet.
Uma parte importante do projeto dessas interfaces é a criação de uma estrutura consistente que é partilhável dentro e talvez fora da empresa, bem como com parceiros de tecnologia e parceiros de negócios.
Durante décadas, os programadores têm usado APIs para fornecer acesso de e para implementações de software. fornecedores de ferramentas e tecnologia vai para grandes comprimentos para garantir que ele é uma tarefa relativamente simples para criar novas aplicações usando seus produtos. Embora muito útil, às vezes é necessário para profissionais de TI para criar personalizado ou APIs proprietárias exclusiva para a empresa.
Talvez seja necessário fazer isso para obter vantagem competitiva, uma necessidade original para a sua organização, ou alguma outra demanda de negócios, e não é uma tarefa simples. APIs precisam ser bem documentados e mantidos para preservar o valor para o negócio. Por esta razão, algumas empresas optam por usar kits de ferramentas API para obter um jump-start sobre esta importante actividade.
toolkits API tem um par de vantagens sobre APIs desenvolvidos internamente. A primeira é que os kits de ferramentas de API são produtos que são criados, gerenciados e mantidos por um terceiro independente. Em segundo lugar, eles são projetados para resolver um requisito técnico específico.
desafios de big data requerem uma abordagem um pouco diferente para o desenvolvimento API ou a adopção. Porque grande parte dos dados não é estruturado e é gerado fora do controle do seu negócio, uma nova técnica, chamada de Processamento de Língua Natural (PLN), está a emergir como o método preferido para fazer a interface entre as grandes dados e seus programas de aplicação.
NLP lhe permite formular consultas com a sintaxe da linguagem natural em vez de uma linguagem de consulta formal, como SQL. Para a maioria dos usuários de big data, será muito mais fácil para perguntar # 147-List todos os consumidores do sexo masculino casadas entre 30 e 40 anos de idade que residem no sudeste dos Estados Unidos e são fãs da NASCAR # 148- do que escrever uma consulta SQL 30-line para a resposta.
Porque encontro a maioria dos dados e movimento tem características muito semelhantes, você pode criar um conjunto de serviços para recolher, limpar, transformar, normalizar e armazenar itens de dados grandes no sistema de armazenamento de sua escolha.
Para criar o máximo de flexibilidade, se necessário, a fábrica poderia ser conduzido com descrições das interfaces escritas em Extensible Markup Language (XML). Este nível de abstração permite interfaces específicas a ser criado com facilidade e rapidez, sem a necessidade de construir serviços específicos para cada fonte de dados.
Na prática, você pode criar uma descrição do SAP ou Oracle Application interfaces usando algo como XML. Cada interface que usam o mesmo software subjacente para migrar dados entre o ambiente de dados grande e o ambiente do aplicativo de produção independente das especificidades de SAP ou Oracle. Se você precisa de recolher dados de sites sociais na internet, a prática seria idêntico.
Descrever as interfaces para os locais em XML, e em seguida, contratar os serviços para mover os dados e para trás. Tipicamente, estas interfaces são documentadas para utilização por técnicos internos e externos.