Como aplicar qualquer Clusters Colony em Análise Preditiva

Um exemplo natural do grupo de auto-organização que você pode aplicar no comportamento análise preditiva é uma colônia de formigas caça para o alimento. As formigas coletivamente otimizar sua faixa para que ele sempre toma o caminho mais curto possível um alvo alimentos.

Mesmo se você tentar perturbar uma colônia de marcha das formigas e impedi-los de chegar ao alvo alimentos que voltar à pista rápida e (novamente) a encontrar o caminho mais curto possível do alvo comida, todos eles evitando os mesmos obstáculos, enquanto procura Comida. Esta uniformidade de comportamento é possível porque cada depósitos de formigas um rastro de feromônios no terreno.

Considere um exército de formigas ociosos em seu ninho. Quando eles começam a olhar para o alimento, eles não têm absolutamente nenhuma informação sobre onde encontrá-lo. Eles marcham aleatoriamente até que uma formiga encontra comida de agora, a sorte formiga (chamemos-lhe Ant X) tem de comunicar a sua localização para o resto das formigas - e para fazer isso, ele deve encontrar o seu caminho de volta para o ninho.

Felizmente, Ant X estava produzindo seus próprios feromônios todo o tempo que estava à procura de comida de que pode seguir o seu próprio rastro de feromônios de volta para o ninho. Em seu caminho de volta para o ninho, seguindo sua própria trilha de feromônio, Ant X coloca mais feromônios na mesma trilha.

Como resultado, o cheiro na pista de Ant X será o mais forte entre todas as trilhas das outras formigas. A trilha mais forte de feromônios vai atrair todas as outras formigas que ainda estão à procura de alimentos. Eles vão seguir o cheiro mais forte. À medida que mais formigas se juntar a trilha de Ant X, eles adicionar mais feromônios para it- o cheiro se torna mais forte. Em breve, todas as outras formigas têm um forte cheiro a seguir.

Se várias formigas descobriram a mesma fonte de alimento, as formigas que tiveram o caminho mais curto vai fazer mais viagens em comparação com formigas que seguem caminhos mais longos - mais feromônios serão produzidos por conseguinte, sobre o caminho mais curto. A relação entre o comportamento individual e coletivo é um exemplo natural esclarecedor.

Cada ponto representa um documento. Suponha que os pontos pretos são documentos sobre a análise preditiva e os pontos brancos são documentos sobre antropologia. Os pontos que representam os diferentes tipos de documentos são distribuídos aleatoriamente em grelha de cinco células.

# 147 Ants # 148- são implantados aleatoriamente na grade para procurar documentos semelhantes. Cada célula com um valor que representa uma instância de um # 147 feromônio. # 148- usando a matriz de documentos, de cada célula # 147 feromônio # 148- valor é calculado a partir do documento correspondente.

image0.jpg

Ok, como é que a inteligência coletiva de uma colônia de formigas produzir um modelo para Cluster eficazmente os dados? A resposta está em uma analogia simples: As formigas estão à procura de alimentos em seu ambiente, tanto quanto nós estamos à procura de aglomerados em um conjunto de dados - à procura de documentos semelhantes dentro de um grande conjunto de documentos.

Considere um conjunto de dados de documentos que você deseja organizar por assunto. documentos semelhantes serão agrupados no mesmo cluster. Aqui é onde a colônia de formigas pode fornecer dicas sobre como agrupar documentos semelhantes.

Imagine uma grade bidimensional (2D), onde você pode representar documentos como pontos. A grade 2D é dividida em células. Cada célula tem um # 147 feromônio # 148- (valor) associado a ele. Resumidamente, o # 147 feromônio valor # 148- distingue cada documento em uma determinada célula.

Os pontos são inicialmente distribuídas aleatoriamente - e cada ponto na grade representa um documento original. O próximo passo é implantar outros pontos aleatoriamente na grade 2D, simulando busca da colônia de formigas para o alimento em seu ambiente. Esses pontos são inicialmente espalhados na mesma grelha 2D com os documentos.

Cada novo ponto adicionada à grade representa uma formiga. Essa Número 147-formigas, # 148- frequentemente referidos no algoritmo ant-colónia como agentes, estão se movendo na grade 2D. Cada # 147-ant # 148- vão quer pegar ou deixar os outros pontos (documentos), dependendo de onde os documentos melhores pertencem. Nessa analogia, o # 147-food # 148- assume a forma de documentos suficientemente semelhantes que podem ser agrupados.

A # 147-ant # 148- caminha aleatoriamente na grid- se encontrar um documento, ele pode executar uma das duas ações: pegar ou largar. Cada célula tem um # 147 feromônio intensidade # 148- que indica quão semelhantes o documento é os outros documentos (pontos) que residem perto do documento em questão - a que um # 147-ant # 148- está prestes a quer pegar ou deixar.

Note-se que o # 147-ant # 148- no celular 3 vai pegar o documento em preto-pontilhado porque o branco # 147 feromônio valor # 148- é dominating- e ir para uma célula onde o valor é próximo (similar) para o que está no celular 4 (vários pontos pretos). A busca continua repetindo até que os aglomerados se formam.

image1.jpg

Com efeito, o # 147-ant # 148- move documentos a partir de uma célula para outra para formar grupos através da realização de qualquer uma das duas únicas ações: pegar um documento ou deixar cair um documento.

Quando o Número 147-formigas # 148- começou a se mover aleatoriamente na grade, encontrando um ponto resultados (documento) na # 147-ant # 148- pegar um documento a partir da sua célula atual, movendo-se com ele, e deixá-la cair em uma célula em que teve semelhança suficiente para caber.

Como seria um # 147-ant # 148- determinar a melhor célula na qual a cair um documento? A resposta é que os valores nas células agem como # 147-feromonas 148- # - e cada célula na grelha 2D contém um valor numérico, que pode ser calculada de uma forma que representa um documento na célula.

Lembre-se que cada documento é representado como um conjunto de números ou um vetor de valores numéricos. o # 147 intensidade do feromônio # 148- (o valor numérico) aumenta quando mais documentos são jogados para dentro da célula - e esse valor diminui se os números que representam documentos são movidos para fora da célula.

menu