RDBMSs em um ambiente de dados Big
Big data está se tornando um elemento importante na forma como as organizações estão utilizando dados de alto volume na velocidade certa para resolver problemas específicos de dados. Relational Database Systems Management são importantes para esse alto volume. O big data não viver em isolamento. Para ser eficaz, as empresas muitas vezes precisam de ser capaz de combinar os resultados de análise de dados grande com os dados que existe dentro da empresa.
Menu
noções básicas de big data: dados RDBMS e persistentes
Um dos serviços mais importantes prestados por bancos de dados operacionais (também chamado armazenamentos de dados) É a persistência. Persistência garante que os dados armazenados numa base de dados não irá ser alterada sem permissões e que estará disponível, enquanto que é importante para o negócio. Que bom é um banco de dados se ele não pode ser confiável para proteger os dados que você colocar nele?
Tendo em conta este requisito mais importante, então você deve pensar sobre o tipo de dados que deseja persistem, como você pode acessar e atualizar-lo, e como você pode usá-lo para tomar decisões de negócios. Neste nível mais fundamental, a escolha de seus bancos de dados é fundamental para o seu sucesso global com a sua aplicação de dados grande.
Mesmo que a tecnologia subjacente tem sido em torno de algum tempo, muitos desses sistemas estão em operação hoje, porque as empresas que apoiam são altamente dependente dos dados. Para substituí-los seria como mudar os motores de um avião em um vôo transoceânico.
noções básicas de Big data: RDBMS e tabelas
Bancos de dados relacionais são construídos sobre uma ou mais relações e são representados por tabelas. Estas tabelas são definidos pelas suas colunas e os dados são armazenados em linhas. A chave primária é muitas vezes a primeira coluna na tabela. A consistência do banco de dados e muito do seu valor são alcançados por "normalizar" os dados. de dados normalizado foi convertido do formato nativo em um compartilhada, acordado formato.
Por exemplo, em uma base de dados que possa ter "telefone" como XXX-XXX-XXXX enquanto em outro que pode ser XXXXXXXXX. Para alcançar uma visão consistente das informações, o campo terá de ser normalizado para uma outra forma. existem cinco níveis de padrões para a normalização. A escolha da forma normal é muitas vezes relegado para o designer de banco de dados. O conjunto de tabelas, chaves, elementos, e assim por diante conhecida como a base de dados esquema.
Ao longo dos anos, a linguagem de consulta estruturada (SQL) evoluiu na etapa de bloqueio com a tecnologia RDBMS e é o mecanismo mais utilizado para criar, consultar, manutenção e operação de bancos de dados relacionais.
Em empresas pequenas e grandes, a maioria de sua informação operacional importante é, provavelmente, armazenadas em RDBMSs. Muitas empresas têm RDBMSs diferentes para diferentes áreas do seu negócio. dados transacionais pode ser armazenada na base de dados de um fornecedor, ao passo que as informações dos clientes podem ser armazenados em outro.
Não é provável que você irá usar RDBMSs para o núcleo da implementação, mas você vai precisar contar com os dados armazenados no RDBMSs para criar o mais alto nível de valor para o negócio com big data.
PostgreSQL, um banco de dados relacional de código aberto
Durante a sua aplicação de dados grande, é provável que você se deparar PostgreSQL, um amplamente utilizado, banco de dados relacional de código aberto. Vários fatores contribuem para a popularidade do PostgreSQL. Como um RDBMS com suporte para o padrão SQL, que faz todas as coisas que esperar de um produto de banco de dados, além de sua longevidade e uso largo tornaram "batalha testada." Ele também está disponível em praticamente todas as variedades de sistema operacional, de PCs a mainframes.
Fornecendo o básico e fazê-lo de forma confiável são apenas parte da história. O PostgreSQL também suporta vários recursos encontrados somente em caros RDBMSs proprietária, incluindo o seguinte:
Capacidade de lidar diretamente "objetos" dentro do esquema relacional
chaves estrangeiras (referenciando as chaves de uma tabela em outra)
Triggers (eventos utilizados para iniciar automaticamente um procedimento armazenado)
consultas complexas (subconsultas e junta-se em mesas separadas)
integridade transacional
controle de concorrência Multiversion
O verdadeiro poder do PostgreSQL é a sua extensibilidade. Usuários e programadores de banco de dados pode adicionar novos recursos sem afetar a operação fundamental ou a confiabilidade do banco de dados. extensões possíveis incluem
Tipos de dados
operadores
Funções
métodos de indexação
As linguagens procedurais
Este alto nível de personalização faz PostgreSQL desejável quando rígidas, produtos proprietários não vai começar o trabalho feito. É extensível infinitamente.
Finalmente, a licença do PostgreSQL permite a modificação e distribuição, sob qualquer forma, de código aberto ou fechado. Quaisquer modificações podem ser mantidos privados ou compartilhados com a comunidade como você deseja.