Como escolher uma arquitetura de cluster Hadoop
Hadoop é projetado para ser implantado em um grande aglomerado de computadores em rede, com nós mestre (que hospedam os serviços que controlam o armazenamento e processamento de Hadoop) e nós escravos (onde os dados são armazenados e processados). Você pode, no entanto, executar Hadoop em um único computador, que é uma ótima maneira de aprender as noções básicas de Hadoop através da experimentação em um espaço controlado.
Hadoop tem dois modos de implantação: o modo distribuído-pseudo e modo totalmente distribuído, ambos os quais são descritos aqui.
de modo distribuído pseudo-(nó único)
Um único nó implantação Hadoop é referido como sendo executado Hadoop em pseudo-distribuído mode, onde todos os serviços do Hadoop, incluindo os serviços de mestre e escravo, todos executados em um nó de computação única. Esse tipo de implantação é útil para testar rapidamente aplicativos enquanto você estiver desenvolvendo-los sem ter que se preocupar sobre como usar os recursos de cluster Hadoop alguém pode precisar.
É também uma maneira conveniente de experimentar com Hadoop, como a maioria de nós não tem clusters de computadores à nossa disposição.
Modo totalmente distribuído (um conjunto de nodos)
A implantação Hadoop, onde os serviços de mestre e escravo Hadoop executado em um cluster de computadores está sendo executado em que é conhecido como modo totalmente distribuído. Este é um modo apropriado para clusters de produção e pólos de desenvolvimento. Uma outra distinção pode ser feita aqui: a Pólo de desenvolvimento normalmente tem um pequeno número de nós e é usado para fazer o protótipo as cargas de trabalho que eventualmente executados em um cluster de produção.