Como começar com o Apache Hive
Não há melhor maneira de ver o que é aquilo que para instalar o software Hive e dar-lhe um teste. Tal como acontece com outras tecnologias no ecossistema Hadoop, ele não leva muito tempo para começar.
Se você tem o tempo ea largura de banda de rede, é sempre melhor para baixar um todo distribuição Apache Hadoop com todas as tecnologias integradas e pronto para ser executado.
Se você tomar o caminho-de distribuição completo, uma abordagem popular para aprender os meandros do Hive é executar a sua distribuição Hadoop em uma máquina virtual Linux (VM) em um laptop de 64 bits com capacidade com RAM suficiente. (Oito gigabytes ou mais de RAM tende a funcionar bem se o Windows 7 está hospedando o seu VM.)
Você também precisa de Java 6 ou posterior e - é claro - um sistema operacional suportado: Linux, Mac OS X ou Cygwin, para fornecer um shell Linux para usuários do Windows.
As etapas de configuração mais ou menos assim:
Faça download da versão mais recente seção.
Você também precisa dos subsistemas Hadoop MapReduce e, por isso, certifique-se de concluir a Etapa 2.
Baixar Hadoop versão 1.2.1.
Usando os comandos na listagem a seguir, coloque os lançamentos em diretórios separados, em seguida, descompactar e descompactar-los.
(untar é um desses termos Unix traquinas que significa simplesmente para expandir um pacote de software arquivado.)
$ Mkdir hadoop- cp hadoop-1.2.1.tar.gz hadoop- cd hadoop $ gunzip hadoop-1.2.1.tar.gz $ tar xvf * .tar $ mkdir hive- cp hive hive-0.11.0.tar.gz - cd colmeia $ gunzip colmeia-0.11.0.tar.gz $ tar xvf * .tar
Usando os comandos no seguinte perfil, configurar suas variáveis de ambiente Apache Hive, incluindo HADOOP_HOME, JAVA_HOME, HIVE_HOME e PATH, no seu script de perfil shell.
exportação HADOOP_HOME = / home / user / colmeia / hadoop / hadoop-1.2.1export JAVA_HOME = / opt / jdkexport HIVE_HOME = / home / user / colmeia / colmeia-0.11.0export PATH = $ HADOOP_HOME / bin: $ HIVE_HOME / bin: $ JAVA_HOME / bin: $ PATH
Criar o arquivo de configuração Hive que você vai usar para definir configurações específicas de configuração colmeia.
A distribuição Apache Hive inclui um arquivo de configuração do modelo que fornece todas as configurações padrão para a colmeia. Para personalizar Hive para o seu ambiente, tudo que você precisa fazer é copiar o arquivo de modelo para o arquivo nomeado colmeia-site.xml e editá-lo.
Usando seu editor favorito, modificar o arquivo de hive-site.xml para que ele inclui apenas o # 147 hive.metastore.warehouse.dir # 148- propriedade para agora. Quando concluído, ele será parecido com o arquivo XML abaixo. Note-se que os comentários foram removidos para encurtar a listagem:
$ Cd $ HIVE_HOME / conf $ cp colmeia-default.xml.template colmeia-site.xmllt;? Xml version = "1.0"> lt;? Tipo xml-stylesheet = "text / xsl" href = "configuration.xsl" ?>