Compreender Dados Não Estruturados

dados não estruturados é diferente de dados estruturados em que a sua estrutura é imprevisível. Exemplos de dados não estruturados incluem documentos, e-mails, blogs, imagens digitais, vídeos e imagens de satélite. Ele também inclui alguns dados gerados por máquinas ou sensores. De fato, dados não estruturados representa a maioria dos dados que estão nas instalações da sua empresa, bem como externo para sua empresa em fontes privadas e públicas online, como Twitter e Facebook.

No passado, a maioria das empresas não foram capazes de qualquer captura ou armazenar esta vasta quantidade de dados. Era simplesmente muito caro ou muito grandes. Mesmo que as empresas foram capazes de capturar os dados, eles não têm as ferramentas para analisar facilmente os dados e usar os resultados para tomar decisões. algumas ferramentas muito poderia dar sentido a essas grandes quantidades de dados. As ferramentas que existiam eram complexos de usar e não produzir resultados em um prazo razoável.

No final, aqueles que realmente queria ir para o enorme esforço de analisar esses dados foram forçados a trabalhar com instantâneos de dados. Isto tem o efeito indesejável de perder eventos importantes, porque eles não estavam em um instantâneo particular.

Uma abordagem que está se tornando cada vez mais valorizada como uma forma de agregar valor aos negócios de dados não estruturados é análise de texto, o processo de análise de texto não estruturado, extrair informações relevantes, e transformando-os em informações estruturadas que podem ser aproveitados de várias maneiras. Os processos de análise e extração de tirar proveito das técnicas que se originaram em linguística computacional, estatística e outras disciplinas de ciência da computação.

menu