Coleta de dados estruturados e não estruturados

Os dados recolhidos no passado foi estruturado e poderia caber em linhas e colunas arrumadas. Um exemplo disso seria uma planilha do Excel com os dados delimitados (dados que foram separados por um carácter específico, como uma vírgula). A maioria dos especialistas em informação internos estavam satisfeitos em apresentar esses dados (tais como registros de clientes) em longas planilhas. Eles foram incumbidos de relatar o que disse que os dados, e todos usaram os mesmos resultados.

Com dados estruturados, não houve oportunidade de visualizar a história de que os dados disse para extrair informações valiosas. Os dados não foi interativo e não permitir a personalização. Foi valioso para um ponto, mas não havia maneira de entender o que o cliente pensou sobre o produto depois que comprei. Você só saberia aquele o produto foi comprado. E que os dados é apenas uma parte do quebra-cabeça.

Hoje, as empresas estão enfrentando uma montanha de um novo tipo de dados: dados não estruturados, o que nem sempre vêm em um pacote arrumado. Seguem-se alguns exemplos deste tipo de dados:

  • opiniões: Opiniões são recolhidos por sites de revisão como Yelp, mostrado na figura a seguir. Você pode acessar os comentários diretamente ou usar uma ferramenta que raspa os dados do site para que você pode colocar esses dados em sua própria ferramenta de viz de dados.

    image0.jpg
  • visuals: Visuais são escolhidos pelos usuários de sites como o Pinterest, mostrado na figura abaixo. No caso do Pinterest, você pode acessar o site para ver o que as imagens sobre e sua empresa têm sido preso por clientes que estão à procura de nome da sua empresa. Você pode ter dados sobre o que os pinos que sua empresa colocou no Pinterest estão sendo re-preso por outros, bem como dados sobre pessoas que viram o produto da sua empresa ou a imagem em outros lugares na web e ter fixado-lo diretamente a Pinterest para que outros possam encontrar.

    image1.jpg
  • dos dados do smartphone: registros de telefone, e-mails e outros dados de pesquisa estão disponíveis a partir do seu telefone.

Este conteúdo não estruturado representa dados que é incrivelmente valioso para qualquer negócio on-line. A chave para usar os dados é utilizar programas de software (como SAP) que lhe permitem combinar dados estruturados com dados não estruturados para obter uma maior compreensão do negócio e seus clientes. A partir desta análise, as empresas podem começar a fazer previsões sobre o comportamento do cliente e geração de receita.

Normalmente, as organizações que usam dados não estruturados usar software de processamento de linguagem natural para analisá-lo.

menu