Gerenciar Virtualização para Big Data

Virtualização separa os recursos e serviços do ambiente de entrega física subjacente, permitindo que você crie muitos sistemas virtuais dentro de um único sistema físico. Uma das principais razões que as empresas implementaram a virtualização é para melhorar o desempenho ea eficiência do processamento de um mix diversificado de cargas de trabalho

O hypervisor de dados grande

Em um mundo ideal, você não quer se preocupar com o sistema operacional subjacente e o hardware físico. UMA hypervisor é a tecnologia responsável por assegurar que o compartilhamento de recursos ocorre de forma ordenada e repetitiva.

O hypervisor senta-se nos níveis mais baixos do ambiente de hardware e usa uma fina camada de código para habilitar o compartilhamento de recursos dinâmicos. O hypervisor faz parecer que cada sistema operacional tem os recursos físicos todos a si mesmo.

No mundo dos grandes dados, pode ser necessário para suportar muitos diferentes ambientes operacionais. O hypervisor torna-se um mecanismo de entrega ideal para os componentes de tecnologia da pilha de dados grande. O hypervisor permite mostrar a mesma aplicação em lotes de sistemas sem ter que copiar fisicamente que a aplicação em cada sistema.

Como um benefício adicional, por causa da arquitetura hypervisor, ele pode carregar quaisquer sistemas operacionais diferentes, como se fossem apenas uma outra aplicação. Assim, o hypervisor é uma maneira muito prática de fazer as coisas virtualizados com rapidez e eficiência.

Os sistemas operacionais convidados são os sistemas operacionais rodando em máquinas virtuais. Com a tecnologia de virtualização, você pode configurar o hypervisor para dividir os recursos do computador físico. Os recursos podem ser divididos 50/50 ou 80/20 entre dois sistemas operacionais convidados, por exemplo.

A beleza deste arranjo é que o hypervisor faz todo o trabalho pesado. O sistema operacional convidado não se importa que ele está sendo executado em um particionamento virtual que pensa que tem um computador só para ela.

Você encontra basicamente dois tipos de hypervisors:

  • Tipo 1 hypervisors executar diretamente na plataforma de hardware. Eles alcançar maior eficiência, porque eles estão correndo diretamente na plataforma.

  • Tipo 2 hypervisors executado no sistema operacional hospedeiro. Eles são freqüentemente usados ​​quando existe uma necessidade de apoiar uma ampla gama de dispositivos de E / S.

Abstração e big data virtualização

Para recursos de TI e serviços para ser virtualizado, eles são separados do ambiente de entrega física subjacente. O prazo para esse ato de separationis chamada abstração. A abstração é um conceito chave na big data. MapReduce e Hadoop são distribuídos ambientes de computação onde tudo é abstraída. O detalhe é abstraída para que o desenvolvedor ou analista não precisa se preocupar com o local onde os elementos de dados estão localizados.

Abstraction minimiza a complexidade de algo ocultando os detalhes e fornecendo apenas as informações relevantes. Por exemplo, se você estava indo para pegar alguém que você nunca viu antes, ele poderia dizer-lhe o local para encontrá-lo, e que ele vai usar. Ele não precisa de dizer-lhe onde ele nasceu, quanto dinheiro ele tem no banco, sua data de nascimento, e assim por diante.

Essa é a idéia com a abstração - é sobre o fornecimento de uma especificação de alto nível, em vez de entrar em muitos detalhes sobre como algo funciona.

Implementar a virtualização para trabalhar com big data

A virtualização ajuda faz seu ambiente de TI inteligente o suficiente para lidar com a análise de dados grande. Ao otimizar todos os elementos da sua infra-estrutura, incluindo hardware, software e armazenamento, você ganha a eficiência necessária para processar e gerenciar grandes volumes de dados estruturados e não estruturados. Com os dados grandes, você precisa acessar, gerenciar e analisar dados estruturados e não estruturados em um ambiente distribuído.

dados assume grande distribuição. Na prática, qualquer tipo de MapReduce irá funcionar melhor em um ambiente virtualizado. Você precisa da capacidade de mover cargas de trabalho em torno de com base em requisitos de energia e armazenamento de computação.

Virtualização irá permitir-lhe enfrentar os problemas maiores, que ainda não foram escopo. Você pode não saber com antecedência o quão rápido você precisará escalar.

Virtualização irá permitir-lhe suportar uma variedade de operacionais grandes armazenamentos de dados. Por exemplo, um banco de dados gráfico pode ser girado para cima como uma imagem.

O benefício mais direto de virtualização é garantir que os motores de MapReduce funcionar melhor. Virtualização resultará em uma melhor escala e desempenho para MapReduce. Cada um dos Map e Reduce tarefas precisa ser executado de forma independente. Se o motor MapReduce é paralelizado e configurado para ser executado em um ambiente virtual, você pode reduzir a sobrecarga de gerenciamento e permitir expansões e contrações nas cargas de trabalho de tarefas.

-se MapReduce é inerentemente paralela e distribuída. Ao encapsular o mecanismo MapReduce em um recipiente virtual, você pode executar o que você precisa sempre que você precisar. Com a virtualização, você aumenta a sua utilização dos ativos que você já pagou por transformá-los em pools genéricas de recursos.

menu