O Data Warehouse Lite

Um lite data warehouse é um bom gosto, nu-ossos, a abordagem de baixa tecnologia para fornecer dados que podem ajudar com algum do seu negócio de tomada de decisão. Sem frescuras significa que você colocar juntos, sempre que possível, recursos comprovados e ferramentas já dentro de sua organização para construir o seu sistema.

áreas temáticas e conteúdo de dados de um Lite data warehouse

Um lite data warehouse está focada no relatório ou análise de apenas uma ou possivelmente duas áreas. Suponha-se que em seu trabalho em uma divisão sem fio de uma empresa de telefonia, você analisar as vendas de serviços, tais como minutos em rede, fora-de-rede minutos, mensagens de texto, acesso à Internet, e outro uso móvel para famílias de consumo.

Se você construir um Lite armazém de dados exclusivamente para esse fim, você tem todas as informações necessárias para apoiar a sua análise e geração de relatórios para o mercado consumidor. Você não tem nenhuma informação sobre usuários de negócios e histórico de pagamento, no entanto, porque essa informação é parte de uma área temática diferente, como mostrado nesta figura.

image0.jpg

Com base no limite de área de assunto, um Lite armazém de dados tem apenas o conteúdo de dados suficiente para satisfazer o objetivo principal do ambiente, mas não o suficiente para muitos não-estruturados cenários hipotéticos seus usuários podem criar.

Você deve escolher com cuidado, portanto, de entre o conjunto de todos os elementos de dados possíveis e selecionar um subconjunto gerenciável - elementos que, sem dúvida, são importantes para ter. Este processo é o mesmo para qualquer implementação de data warehouse, exceto que você deve ser extremamente disciplinado quando você está fazendo decisões sobre o conteúdo a ser incluído.

Use relatórios standard, particularmente aquelas que atualmente requerem uma grande quantidade de preparação manual, como um dos seus guias primárias para determinar o conteúdo de dados em um data warehouse Lite.

Fontes de dados

Um lite armazém de dados tem um conjunto limitado de fontes de dados - normalmente, um a um punhado. Como parte de um ambiente geral de aplicação única, por exemplo, os de data warehouse atos Lite como o agente de reestruturação para os dados do aplicativo para torná-lo mais query- e reportar-friendly.

O meio mais comum de reestruturação de dados de uma única aplicação é para desnormalizar o conteúdo das tabelas de banco de dados relacionais da aplicação para eliminar o maior número relacional operações de junção (O processo de reunir dados de mais de uma tabela de banco de dados) quanto possível quando os usuários executar relatórios ou fazer consultas simples.

Desnormalização é o oposto do conceito de banco de dados relacional de normalização, um conjunto um pouco complexo de orientações que lhe diz quais os elementos de dados devem estar em quais tabelas em um banco de dados.

Quando você desnormalizar um banco de dados, você não se preocupar com duplicado de dados tenta criar linhas de dados em uma única tabela que provavelmente reflete os relatórios e consultas que os usuários executam. Esta figura mostra um exemplo de um Lite armazém de dados de fonte única construída sobre desnormalização.

image1.jpg

Embora você possa usar os dados fornecidos externamente em uma implementação Lite armazém de dados, os dados usados ​​raramente é recém-adquirida. Você é mais provável para incorporar dados que você já usa para análise (talvez de uma forma stand-alone).

ferramentas de business intelligence

Os usuários de um Lite data warehouse normalmente fazer perguntas e criar relatórios que refletem uma # 147 Diga-me o que aconteceu # 148- perspectiva. Porque os usuários não fazem muito processamento analítico pesados, os produtos que eles usam para acessar o data warehouse deve ser fácil para eles usarem.

extração de dados, movimento e de carga

Simplicidade é o nome do jogo em um Lite data warehouse. Portanto, tornar o processo de extração de dados a partir de fontes e realizando todas as funções necessárias para preparar os dados para o carregamento tão simples quanto possível, usando estes dois elementos:

  • extratos de arquivos simples a partir dos sistemas run-a-negócio e transferências de arquivos que lhe permitem mover dados de suas nascentes até à Lite data warehouse

  • código personalizado simples (ou talvez um fácil de usar ferramenta) que pode extrair e mover os dados

Se a fonte de dados para o seu Lite armazém de dados é construído sobre um banco de dados relacional e você estiver planejando usar o mesmo produto de banco de dados para o seu armazém de dados, use o SQL para lidar facilmente com a extração de dados e movimento. Estes passos - como mostrado na figura - fornecem um procedimento padrão para este processo (você vai querer adaptar estas etapas para seu ambiente específico, é claro):

  1. No sistema que abriga o seu armazém, utilize a instrução SQL CREATE TABLE para criar a definição para cada tabela em seu Lite data warehouse.

  2. Criar um banco de dados cópia de segurança que contém cópias de todas as tabelas a partir da fonte que fornecem dados para o armazém, e depois recarregar essas tabelas em uma área de teste no sistema em que você planeja para localizar seu data warehouse.

    Você deve garantir que a largura de banda de rede e janela de tempo são adequados para copiar todas as tabelas de origem para o sistema usando um programa de transferência de arquivos.

  3. Use a instrução SQL INSERT, com uma instrução SELECT aninhada especificando as tabelas de origem e suas respectivas colunas que vai preencher a tabela de armazém de dados (e como as tabelas serão unidas), para carregar os dados em seu Lite data warehouse.

  4. Executar uma série de garantia de qualidade (QA) rotinas para verificar que todos os dados foi carregado corretamente.

    Verifique contagens de linha, totais numéricos, e tudo aquilo que puder.

    image2.jpg

Arquitetura

A arquitetura de um Lite armazém de dados é composto de banco de dados usado para armazenar os dados, as ferramentas de inteligência de negócios de front-end usados ​​para acessar os dados, a forma como os dados são movidos, eo número de áreas temáticas. A palavra de ordem deste ambiente é minimalista: não sinos, sem assobios, nada sofisticados - apenas o suficiente tecnologia aplicada ao ambiente para dar aos usuários acesso a dados de que necessitam.

A arquitectura de uma Lite armazém de dados, como mostrado nesta figura, contém estes tipos principais de componentes:

  • Um único banco de dados contém dados do armazém.

  • Esta base de dados é alimentado directamente a partir de cada uma das fontes que fornecem os dados para o armazém.

  • Os usuários acessam os dados directamente a partir do armazém.

    image3.jpg

menu