Utilitários para repositório de dados

Como com jeans boca de sino, bancos de dados assistida por hardware estão na trilha do retorno. Microsoft, Oracle e Netezza são toda a raiva em seminários de banco de dados ao redor do globo. Em meados da década de 1980 em atraso, fornecedores Britton Lee e Teradata (que eventualmente se fundiram) eram toda a raiva.

Eles forneceram máquinas dedicadas que otimizadas de processamento de banco de dados - as primeiras máquinas utilizadas pelos consumidores de dados pesados, incluindo muitas das empresas de bens embalados para o consumidor.

O objetivo dessas caixas era de dedicar todos os aspectos de um computador para a obtenção de dados para os usuários mais rápido. Esta máquina dedicada incluiu uma operação de banco de dados, memória, CPU e disco centrado na consulta. Eventualmente, esses produtos movidos fora de moda, e os sistemas de gestão de bases de dados foram migrados para uma arquitetura de gerência on-qualquer-box mais aberto.

Agora, eles estão de volta!

UMA appliance de data warehouse é um conjunto integrado de servidores, armazenamento, sistema operacional, DBMS e software especificamente pré-instalado e pré-otimizados para armazenamento de dados. utilitários para repositório de dados fornecem soluções para o meio-de-grande volume de mercado de data warehouse, oferecendo um desempenho de baixo custo em volumes de dados no terabyte para petabytes gama (que é um monte de dados!).

A maioria dos fornecedores de aparelhos de data warehouse utilizar arquiteturas massivamente paralelo de processamento (MPP) para proporcionar um desempenho de alta consulta e escalabilidade da plataforma. arquiteturas MPP consistem em processadores independentes ou servidores que executam em paralelo.

A maioria das arquiteturas MPP implementar um arquitetura nada compartilhada, em que cada servidor é auto-suficiente e controla sua própria memória e disco. arquiteturas nada compartilhados têm um histórico comprovado em alta escalabilidade e pouca contenção.

A maioria dos utilitários para repositório de dados distribuir dados em unidades de armazenamento em disco dedicados conectados a cada servidor no aparelho. Essa distribuição permite que os aparelhos para resolver uma consulta relacional através da digitalização de dados em cada servidor em paralelo. A abordagem de dividir e conquistar oferece alto desempenho e escalas linearmente quando você adicionar novos servidores na arquitetura.

E, a partir de uma perspectiva de preço, a maioria dos fornecedores nesta arena está tentando uma estratégia de plug-and-play. Por exemplo, Netezza normalmente vende um novo usuário seu produto como plug-compatível com a Teradata para menos que o custo de manutenção Teradata. Este ponto de preço torna os produtos muito atraente, dando-lhes uma taxa de adoção crescente.

menu