Apache Hadoop e Bigtop

Para ajudar você a começar com Hadoop, aqui estão as instruções sobre como fazer o download de forma rápida e configurar o Hadoop em seu próprio computador portátil. O cluster será executado em modo distribuído-pseudo em uma máquina virtual, assim você não vai precisar de hardware especial.

UMA máquina virtual (VM) é um computador simulado que você pode executar em um computador real. Por exemplo, você pode executar um programa no seu computador portátil que # 147 execuções # 148- uma VM, que abre uma janela que parece que está executando outro computador. Com efeito, um computador de mentira está sendo executado dentro do computador real.

Você vai ser o download de um VM, e ao mesmo tempo de executá-lo, você vai instalar o Hadoop.

Apache Bigtop é uma ótima alternativa se você quiser montar seus próprios componentes do Hadoop. Bigtop reúne os principais componentes do Hadoop para você e garante que a sua configuração funciona. Apache Bigtop é uma distribuição open source 100 por cento.

O principal objetivo do Bigtop - em si um projeto Apache, assim como Hadoop - é construir uma comunidade em torno da embalagem, implantação e integração de projectos no ecossistema Apache Hadoop. O foco é sobre o sistema como um todo e não em projectos individuais.

Usando Bigtop, você pode facilmente instalar e implantar componentes do Hadoop sem ter de encontrá-los em uma distribuição específica e combiná-los com uma versão específica Hadoop. À medida que novas versões dos componentes do Hadoop são liberados, eles às vezes não trabalhar com os mais novos lançamentos de outros projetos. Se você está por sua conta, testes significativa é necessária.

Com Bigtop (ou uma versão comercial do Hadoop) você pode confiar que os especialistas Hadoop ter feito este teste para você. Para lhe dar uma ideia de como Bigtop expansiva tem obtido, consulte a seguinte lista de todos os componentes incluídos no Bigtop:

  • Apache Crunch

  • Apache Flume

  • Apache Giraph

  • HBase

  • Apache HCatalog

  • Apache Hive

  • Apache Mahout

  • Apache Oozie

  • Apache Pig

  • Apache Solr

  • Apache Sqoop

  • Apache whirr

  • Apache Zookeeper

  • Cloudera Hue

  • LinkedIn DataFu

Esta coleção de projetos do ecossistema Hadoop é quase tão extensa quanto ele ganha, como ambos os projetos maiores e menores estão incluídos. Apache Bigtop está em constante evolução.

menu