A sua empresa tem estruturas de dados existentes?

Sua organização tem chances esmagadoramente favoráveis ​​de ter pelo menos um classificar-de data warehouse

- um sistema de comunicação que fornece capacidades de informação e, às vezes, as capacidades analíticas para um ou mais grupos de usuários.

O que é um arquivo de extração?

Os usuários provavelmente usam o termo Extrair arquivo para descrever este tipo de ambiente, porque isso é povoada por extratos de dados de sistemas de produção, em vez de por usuários de ser forçado a executar suas consultas ou receber os seus relatórios a partir das bases de dados operacionais de produção ou arquivos. Ainda interessado em jogar com as probabilidades? Aqui estão mais alguns exemplos de tipos de ambientes de dados que podem ser descritos como uma espécie-de armazéns de dados:

  • Embora os dados extraídos são quase sempre alojados em um único arquivo ou banco de dados, um processo de intercalação provavelmente combina dados extraídos de mais de uma fonte da aplicação.

  • Apenas elementos, nem todos os elementos de todas as tabelas ou arquivos, a partir de cada fonte de dados geralmente são extraídos e copiados para o arquivo de extração selecionado.

  • Algum tipo de processo de garantia de qualidade de dados é geralmente vai em cada passo do caminho, a partir do extrato inicial para carregar os dados no arquivo de extração.

  • Alguns usuários avançados provavelmente pode executar consultas ou criar programas estatísticos (em SAS ou SPSS, por exemplo) contra os dados, mas muitos usuários não são susceptíveis de tocar os dados diretamente. Em vez disso, eles provavelmente recebem regularmente relatórios gerados automaticamente ou em resposta aos seus pedidos.

Claro soa como um armazém de dados, não é? A realidade é que este tipo-de dados armazéns são normalmente servindo uma população muito pequena e não é feito de uma maneira padrão para suportar as necessidades mais amplas da empresa. Você também pode chamá-los wanna-be data warehouses.

Aqui está a dicotomia da maioria das organizações o acesso aos dados:

  • Análise de dados # 147 que não têm # 148-: Organizações e indivíduos que têm poucos (e mais provável não) capacidades para fazer o tipo de análise que pode trazer voltado para informações de tomada de decisão

  • Análise de dados # 147-haves # 148-: Organizações e indivíduos que podem não ter um armazém de dados instalado e funcionando, mas está fazendo algo com dados que eles estão recebendo a partir de algum lugar. Em muitos casos, ele está adequando suas necessidades de negócios muito bem.

Por que não são extrair arquivos considerados armazéns de dados?

Eles são, de certa forma. Extrair arquivos, se nos anos 1970, 1980, 1990, ou ainda em uso hoje em dia, existem pelas mesmas razões básicas que um data warehouse de pleno direito ou data mart faz: para possibilitar a entrega de informação, apesar de uma série de barreiras, tais como disco -para entender estruturas de dados, # 147-não toque o sistema de produção # 148- regras, ea falta de multi-arquivo ou referência cruzada multi-banco de dados.

Alguns proponentes de armazenamento de dados argumentam que a combinação e reconfigurando os dados simplesmente com a finalidade de geração de relatórios ou para realizar a análise estatística não é um armazém de dados, no sentido moderno do termo. Extrair arquivos não estão equipados com capacidades multidimensionais ou business-análise, como drill-down e giro de dados.

Se você separar o lado armazém de dados (o que é preciso para reunir, mover e reconfigurar os dados de uma ou mais fontes) do lado do negócio-inteligência (o que você faz com os dados depois de tê-lo disponível), a imagem torna-se muito mais clara.

Extrair arquivos, ou o que você quiser chamá-los, são uma parte muito importante da filosofia de quebra de barreira de um armazém de dados. Muitos dos utilizadores que se referem como Número 147-extrair arquivos # 148- são sistemas baseados em arquivos (em vez de construído sobre bases de dados), e eles provavelmente não são flexíveis o suficiente para suportar consultas ad hoc e análise dimensional. Em um sentido real, no entanto, esses ambientes servir o propósito de data warehousing para uso posterior.

Para muitos usuários, recursos de business-análise, como drill-down e de articulação de dados, têm pouco ou nenhum uso - pelo menos, não no contexto de suas definições de trabalho atuais. postos de trabalho dos usuários chamar para a funcionalidade que esses arquivos de extração pode entregar, bem como os relatórios estáticos e análise estatística realizada com esses dados.

A moral da história: Não vá para uma organização que utiliza eficazmente os dados através de arquivos extrair e expor sobre as maravilhas de armazenamento de dados. Em vez disso, ser cauteloso sobre propor qualquer solução de armazenamento de dados que pode ser visto como um passo para trás. Se você fizer esse tipo de proposição, você está em um passeio longo, acidentado.

menu