Como começar com o Apache Hive

Não há melhor maneira de ver o que é aquilo que para instalar o software Hive e dar-lhe um teste. Tal como acontece com outras tecnologias no ecossistema Hadoop, ele não leva muito tempo para começar.

Se você tem o tempo ea largura de banda de rede, é sempre melhor para baixar um todo distribuição Apache Hadoop com todas as tecnologias integradas e pronto para ser executado.

Se você tomar o caminho-de distribuição completo, uma abordagem popular para aprender os meandros do Hive é executar a sua distribuição Hadoop em uma máquina virtual Linux (VM) em um laptop de 64 bits com capacidade com RAM suficiente. (Oito gigabytes ou mais de RAM tende a funcionar bem se o Windows 7 está hospedando o seu VM.)

Você também precisa de Java 6 ou posterior e - é claro - um sistema operacional suportado: Linux, Mac OS X ou Cygwin, para fornecer um shell Linux para usuários do Windows.

As etapas de configuração mais ou menos assim:

  1. Faça download da versão mais recente seção.

    Você também precisa dos subsistemas Hadoop MapReduce e, por isso, certifique-se de concluir a Etapa 2.

  2. Baixar Hadoop versão 1.2.1.

  3. Usando os comandos na listagem a seguir, coloque os lançamentos em diretórios separados, em seguida, descompactar e descompactar-los.

    (untar é um desses termos Unix traquinas que significa simplesmente para expandir um pacote de software arquivado.)

    $ Mkdir hadoop- cp hadoop-1.2.1.tar.gz hadoop- cd hadoop $ gunzip hadoop-1.2.1.tar.gz $ tar xvf * .tar $ mkdir hive- cp hive hive-0.11.0.tar.gz - cd colmeia $ gunzip colmeia-0.11.0.tar.gz $ tar xvf * .tar
  4. Usando os comandos no seguinte perfil, configurar suas variáveis ​​de ambiente Apache Hive, incluindo HADOOP_HOME, JAVA_HOME, HIVE_HOME e PATH, no seu script de perfil shell.

    exportação HADOOP_HOME = / home / user / colmeia / hadoop / hadoop-1.2.1export JAVA_HOME = / opt / jdkexport HIVE_HOME = / home / user / colmeia / colmeia-0.11.0export PATH = $ HADOOP_HOME / bin: $ HIVE_HOME / bin: $ JAVA_HOME / bin: $ PATH
  5. Criar o arquivo de configuração Hive que você vai usar para definir configurações específicas de configuração colmeia.

    A distribuição Apache Hive inclui um arquivo de configuração do modelo que fornece todas as configurações padrão para a colmeia. Para personalizar Hive para o seu ambiente, tudo que você precisa fazer é copiar o arquivo de modelo para o arquivo nomeado colmeia-site.xml e editá-lo.

    Usando seu editor favorito, modificar o arquivo de hive-site.xml para que ele inclui apenas o # 147 hive.metastore.warehouse.dir # 148- propriedade para agora. Quando concluído, ele será parecido com o arquivo XML abaixo. Note-se que os comentários foram removidos para encurtar a listagem:

    $ Cd $ HIVE_HOME / conf $ cp colmeia-default.xml.template colmeia-site.xmllt;? Xml version = "1.0"> lt;? Tipo xml-stylesheet = "text / xsl" href = "configuration.xsl" ?>

menu