Interfaces Script Pig in Hadoop
A linguagem de programação Pig é projetado para lidar com qualquer tipo de dados jogou o seu caminho - estruturado, semi-estruturado, dados não estruturados, o nome dele. programas de suínos podem ser embalados em três maneiras diferentes:
Script: Este método é nada mais do que um arquivo contendo comandos Latino de porco, identificado pelo sufixo .pig (FlightData.pig, por exemplo). Acabar com o seu programa de porco com a extensão .pig é uma convenção, mas não é obrigatório. Os comandos são interpretados pelo compilador Pig Latin e executado na ordem determinada pelo otimizador de porco.
Grunhido: Grunt atua como um interpretador de comandos, onde pode interativamente entrar Pig Latin na linha de comando Grunt e ver imediatamente a resposta. Este método é útil para a criação de protótipos durante o desenvolvimento inicial e com cenários hipotéticos.
incorporado: declarações Latino de porco pode ser executado no âmbito de programas Java, Python, ou javascript.
scripts de porco, comandos shell Grunt Pig, e programas de suínos embarcados pode ser executado no modo local ou no modo de MapReduce.
O shell Grunt fornece um shell interativo para enviar comandos de porco ou executar scripts Pig. Para iniciar o shell Grunt no modo interativo, basta apresentar o porco comando na sua concha.
Para especificar se um script ou shell Grunt é executado localmente ou no modo Hadoop apenas especificá-lo na bandeira -x para o comando porco. O que se segue é um exemplo de como você pode especificar a execução de seu script de porco em modo local
pig -x milesPerCarrier.pig locais
Veja como você executar o script de porco no modo Hadoop, que é o padrão se você não especificar o sinalizador:
pig -x milesPerCarrier.pig mapreduce
Por padrão, quando você especificar o comando de porco sem nenhum parâmetro, ele inicia o shell Grunt no modo Hadoop. Se você deseja iniciar o shell Grunt em modo local basta adicionar a bandeira locais -x para o comando. Aqui está um exemplo
pig -x locais