Como Usar o rebanho do pássaro Clusters em Análise Preditiva

Imagine o comportamento reunindo aves como modelo para os dados de análise preditiva da sua empresa. Cada item de dados corresponde a um único pássaro na flock- uma aplicação Visual adequado pode mostrar o rebanho na ação em um espaço visual imaginário.

Seu conjunto de dados corresponde ao rebanho. O comportamento flocking naturais corresponde a padrões de dados que poderiam passar por descobrir. O objetivo é detectar enxames (clusters de dados) entre os pássaros que reunem-se (elementos de dados).

Reunindo-se o comportamento tem sido utilizado em aplicações da vida real, como operações de resgate robótica baseada e animação por computador. Por exemplo, o produtor do filme Batman Returns comportamento flocking matemática gerado para simular enxames de morcegos e rebanhos do pinguim.

O uso de flocagem comportamento como uma técnica de análise preditiva - análise de dados de uma empresa como bandos de elementos de dados semelhantes - é baseado na dinâmica por trás reunindo comportamento como aparece na natureza.

Reunindo comportamento das aves, peixes, moscas, abelhas e formigas é uma auto-organização sistema- os indivíduos tendem a se mover de acordo com tanto o seu ambiente e as pessoas vizinhas.

Em um bando de pássaros, cada ave aplica três regras principais, enquanto reunindo-se:

  • Separação mantém um pássaro além de seus companheiros de rebanho mais próximos.

  • Alinhamento permite que um pássaro para se mover ao longo da mesma posição média, como a de seus companheiros de rebanho.

  • Coesão mantém o pássaro dentro do rebanho local.

Cada pássaro em um rebanho se move de acordo com essas regras. Um pássaro companheiros de rebanho são aves encontrados dentro de uma certa distância da ave, e a uma certa distância um do outro. Para evitar colisões entre pássaros, uma distância mínima deve ser kept- ele também pode ser matematicamente definida. Tais são as regras que orquestram flocagem comportamento- usá-los para analisar os dados é um próximo passo natural.

Considere um conjunto de dados de usuários da rede social on-line. agrupamento de dados pode identificar comunidades sociais que compartilham os mesmos interesses. Identificar comunidades sociais em uma rede social é uma ferramenta valiosa que pode transformar a maneira como as organizações pensar, agir, operar e gerir as suas estratégias de marketing.

Como você obter um conjunto de dados de usuários de redes sociais? Bem, alguns dos dados e ferramentas já estão disponíveis: principais redes sociais e sites de microblog como o Facebook eo Twitter fornecem uma interface de programação de aplicativos (API) que lhe permite desenvolver programas que podem obter dados públicos postados pelos usuários.

Essas APIs oferecidas pelo Twitter são referidos como Twitter Transmissão APIs. Eles vêm em três tipos principais: público, usuário e riachos do site:

  • fluxos públicos permitir que um usuário para coletar tweets públicos sobre um tópico ou usuário específico, ou apoiar um propósito de análise.

  • fluxos de usuários permitir que um usuário para coletar tweets que são acessíveis por conta do usuário.

  • fluxos de site são para servidores de grande escala que se conectam ao Twitter em nome de muitos usuários.

Agora, suponha que você use esse programa para baixar os dados dos usuários e organizá-lo em um formato tabular, como a matriz mostrada. Ele mostra uma matriz simples que registra as interações on-line de amigos on-line de Zach mais de duas semanas diferentes. Este conjunto de dados é composto por sete elementos e sete características. Os recursos, como mostrado na coluna da tabela são o número de interações entre cada membro e os outros membros.

Há muitas maneiras de aplicar o comportamento de flocagem pássaro para descobrir clusters em grandes conjuntos de dados. Uma das variações mais recentes é o Flock pelo Líder algoritmo de aprendizagem de máquina clustering, inspirados pela descoberta de líderes de aves nas espécies de pombos. O algoritmo prevê elementos de dados que poderia levar um outro grupo de objetos de dados.

Um líder é atribuído, em seguida, os iniciados líder e leva o comportamento flocagem. Ao longo do algoritmo, os líderes podem se tornar seguidores ou discrepantes. Em essência, este algoritmo funciona de uma maneira que segue as regras da "sobrevivência do mais apto".

O Flock pelo algoritmo Líder foi introduzido pela primeira vez por Abdelghani Bellaachia e Anasse Bari no "Bando pela Líder: A Clustering Algorithm Novel Machine Learning Biologicamente Inspirada", publicado como um capítulo no processo dos 2012 Avanços na conferência Swarm Intelligence.

A seguir mostra uma maneira possível para representar dados gerados por trocas sociais on-line mais de duas semanas. Isso mostra que Zach interagiu 56 vezes com Kellie e cinco vezes com Arthur.

Rede social dos membrosInterações com JohnInterações com MikeInterações com ZachInterações com EmmaInterações com KellieInterações com NicoleInterações com Arthur
João-1010124410
Mike -5556575
Zach -64144
Emma -2888
Kellie -55
Nicole -4
Arthur -
Rede social dos membrosInterações com JohnInterações com MikeInterações com ZachInterações com EmmaInterações com KellieInterações com NicoleInterações com Arthur
João-1012100108
Mike -502005
Zach -9013
Emma -221
Kellie -49
Nicole -1
Arthur -

Aqui está um exemplo que descreve como aplicar o algoritmo de flocagem pássaro para analisar os dados da rede social. Como representado, cada membro é representado por uma ave no espaço virtual. Notar que

  • As aves são inicialmente dispersos aleatoriamente no espaço virtual.

  • Cada ave tem uma velocidade e uma posição associada com ele.

  • Velocidade e posição são calculados para cada ave, usando três vetores: a separação, atração e alinhamento.

  • Cada ave move-se de acordo com os três vectores, e este movimento produz o comportamento flocagem visto na natureza.

    image0.jpg

Aqui os dados de interação é analisada semanalmente para encontrar os usuários das redes sociais semelhantes. A cada semana, as aves podem ser visualizados em uma grade simples. As posições destas aves reflectir as interacções de indivíduos reais no mundo real.

image1.jpg

menu