Configurando Oozie Workflows
Como um mecanismo de fluxo de trabalho, Oozie permite executar um conjunto de aplicações Hadoop em uma sequência especificada conhecido como fluxo de trabalho. Você pode configurar fluxos de trabalho Oozie em uma de três maneiras, dependendo de suas circunstâncias particulares. Você pode usar
O arquivo config-default.xml: Define os parâmetros que não mudam para o fluxo de trabalho.
o arquivo job.properties: Define os parâmetros que são comuns para uma determinada implantação do fluxo de trabalho. Definições aqui substituem aquelas feitas no arquivo config-default.xml.
o parâmetros de linha de comando: Define os parâmetros que são específicos para a invocação do fluxo de trabalho. Definições aqui substituem aquelas feitas no arquivo job.properties eo arquivo config-default.xml.
Os detalhes de configuração será diferente, dependendo da ação que eles estão associados. Por exemplo, como você pode ver na ação MapReduce (mapa de ação) na listagem a seguir, você tem muito mais coisas para configurar lá:
...@@ 1 serverName: 8021serverName: 8020 @@ 2 @@ 3 jobConfig.xml ...... mapreduce.map.class dummies.oozie.FlightMilesMapper mapreduce.reduce.class dummies.oozie.FlightMilesReducer mapred.mapoutput.key.class org.apache.hadoop.io.Text mapred.mapoutput.value.class org.apache.hadoop.io.IntWritable mapred.output.key.class org.apache.hadoop.io.Text mapred.output.value.class org.apache.hadoop.io.IntWritable mapred.input.dir '/ Usr / Dirk / flightdata' ... mapred.output.dir '/ Usr / Dirk / flightmiles'
Ao contrário de um sistema de arquivos (fs) ação como a mostrada aqui:
......