Importância do SQL para Hadoop
Há razões que o SQL provou ser resiliente. A indústria de TI teve 40 anos de experiência com SQL, uma vez que foi inicialmente desenvolvido pela IBM na década de 1970. Com o aumento na adoção de bancos de dados relacionais na década de 1980, SQL desde então se tornou uma habilidade padrão para a maioria dos profissionais de TI.
Você pode facilmente ver porque SQL tem sido tão bem sucedida: É relativamente fácil de aprender, e SQL são bastante legível. Esta facilidade pode ser rastreada até um ponto de design de núcleo em SQL - o fato de que é um declarativo língua, ao contrário de um imperativo língua.
Para uma linguagem ser meio declarativo que suas pesquisas lidam apenas com a natureza dos dados que está sendo solicitado - de preferência, não deve haver nada em sua consulta que determina como o tratamento deve ser executado. Em outras palavras, tudo o que você indicar no SQL é o que informação que você quer de volta a partir do sistema - não como obtê-lo.
Em contraste, com uma linguagem imperativa (C, por exemplo, ou Java, ou Python) o seu código consiste em instruções onde você define as ações que você precisa do sistema para executar.
Além das habilidades (facilmente alavancadas) de seus amigável-SQL profissionais de TI, que vale de aplicações de banco de dados 'décadas, também foram construídos com interfaces SQL. Ao falar sobre como Hadoop pode complementar o data warehouse, é claro que as organizações irá armazenar dados estruturados no Hadoop. E, como resultado, eles vão executar alguns de sua lógica de aplicativo existente contra o Hadoop.
Ninguém quer pagar por aplicações de ser reescrita, então uma interface SQL é altamente desejável.
Com o desenvolvimento de interfaces SQL aos dados do Hadoop, uma tendência interessante é que a análise de negócios comerciais e ferramentas de gerenciamento de dados são quase todos entrando na onda Hadoop, incluindo business intelligence reporting- Extract packages- estatística, Transformar e quadros de Carga (ETL) - e uma variedade de outras ferramentas. Na maioria dos casos, a interface para os dados Hadoop é colmeia.