A importância da virtualização para Big Data
Resolver os desafios de big data requer a gestão de grandes volumes de armazenamentos de dados altamente distribuídos juntamente com o uso de aplicativos computadorizado e uso intensivo de dados. Virtualização fornece o nível adicional de eficiência para fazer plataformas de dados grandes em realidade. Embora a virtualização não é tecnicamente um requisito para a análise de dados grande, estruturas de software são mais eficientes em um ambiente virtualizado.
Menu
Virtualização tem três características que suportam a eficiência escalabilidade e operacional necessário para ambientes de dados grandes:
particionamento: Na virtualização, muitas aplicações e sistemas operacionais são suportados em um único sistema físico através da repartição dos recursos disponíveis.
Isolamento: Cada máquina virtual está isolada do seu sistema físico de acolhimento e outras máquinas virtuais. Devido a esse isolamento, se uma instância virtual falhar, as outras máquinas virtuais e o sistema host não são afetados. Além disso, os dados não são compartilhados entre uma instância virtual e outra.
encapsulação: Uma máquina virtual pode ser representado como um único arquivo, para que possa identificá-lo facilmente com base nos serviços que presta.
virtualização Big servidor de dados
Na virtualização de servidores, um servidor físico é dividido em vários servidores virtuais. O hardware e recursos de uma máquina - incluindo a memória de acesso aleatório (RAM), CPU, disco rígido e controlador da rede - pode ser virtualizado em uma série de máquinas virtuais que cada um executa seus próprios aplicativos e sistema operacional.
Uma máquina virtual (VM) é uma representação de uma máquina física que pode executar ou efectuar as mesmas funções que o software de máquina física. Uma fina camada de software é efectivamente inserida no hardware que contém um monitor de máquina virtual, ou hypervisor.
A virtualização de servidores usa o hipervisor para fornecer eficiência no uso de recursos físicos. Claro, instalação, configuração e tarefas administrativas estão associados com a configuração destas máquinas virtuais.
A virtualização de servidores ajuda a garantir que sua plataforma pode escalar conforme necessário para lidar com os grandes volumes e variados tipos de dados incluídos na sua análise de dados grande. Você pode não saber a extensão do volume necessário antes de começar sua análise. Esta incerteza torna a necessidade de virtualização de servidores ainda maior, proporcionando o ambiente com a capacidade de atender à demanda inesperada para o processamento de grandes conjuntos de dados.
Além disso, a virtualização de servidores fornece a base que permite que muitos dos serviços em nuvem usados como fontes de dados em uma análise de dados grande. A virtualização aumenta a eficiência da nuvem que faz com que muitos sistemas complexos mais fácil para optimizar.
virtualização Big aplicativo de dados
virtualização de infra-estrutura de aplicação fornece uma maneira eficiente de gerenciar aplicativos em contexto com a demanda do cliente. A aplicação é encapsulado de uma forma que elimina as suas dependências do sistema de computador físico subjacente. Isso ajuda a melhorar a capacidade de gerenciamento geral e portabilidade da aplicação.
Além disso, a infra-estrutura de software de virtualização de aplicativos normalmente permite codificar as políticas de uso de negócios e técnicas para se certificar de que cada um de seus aplicativos aproveita recursos físicos e virtuais de uma forma previsível. Os ganhos de eficiência são obtidos porque você pode mais facilmente distribuir os recursos de TI de acordo com o valor do negócio relativa de suas aplicações.
virtualização de infra-estrutura de aplicação utilizado em combinação com a virtualização de servidores pode ajudar a garantir que o negócio acordos de nível de serviço sejam atendidos. A virtualização de servidores monitora o uso de CPU e memória, mas não leva em conta variações na prioridade de negócios ao alocar recursos.
virtualização de rede de dados grande
A virtualização de rede fornece uma maneira eficiente de usar a rede como um conjunto de recursos de conexão. Em vez de confiar na rede física para gerenciamento de tráfego, você pode criar várias redes virtuais todos utilizando a mesma implementação física. Isso pode ser útil se você precisa definir uma rede de recolha de dados com um determinado conjunto de características de desempenho e capacidade e outra rede para aplicações com diferentes desempenho e capacidade.
A virtualização da rede ajuda a reduzir esses gargalos e melhorar a capacidade de gerenciar os dados de grandes distribuídos necessários para a análise de dados grande.
processador de dados grande e virtualização de memória
Processador de virtualização ajuda a optimizar o processador e maximizar o desempenho. virtualização de memória desacopla a memória dos servidores.
Na análise de dados grande, você pode ter repetido consultas de grandes conjuntos de dados e a criação de algoritmos analíticos avançados, tudo projetado para procurar padrões e tendências que ainda não são compreendidos. Estas análises avançadas pode exigir muito poder de processamento (CPU) ea memória (RAM). Para alguns desses cálculos, pode levar um longo tempo sem os recursos da CPU e memória suficientes.
Grandes dados e virtualização de armazenamento
A virtualização de dados pode ser utilizado para criar uma plataforma para serviços de dados com ligações dinâmicas. Isto permite que os dados a serem facilmente pesquisadas e ligado através de uma fonte de referência unificado. Como resultado, a virtualização de dados fornece um serviço de resumo que fornece dados de uma forma consistente, independentemente do banco de dados físico subjacente. Além disso, a virtualização de dados expõe dados em cache para todos os aplicativos para melhorar o desempenho.
A virtualização de armazenamento combina recursos de armazenamento físico para que eles sejam mais eficazmente compartilhados. Isso reduz o custo de armazenamento e torna mais fácil para gerenciar armazenamentos de dados necessários para a análise de dados grande.