Noções básicas de Filtros colaborativa baseada pelo usuário na Análise Preditiva
Com uma abordagem baseada no usuário para filtragem colaborativa em análise preditiva, o sistema pode calcular similaridade entre pares de usuários usando a fórmula similaridade do cosseno, uma técnica muito semelhante à abordagem baseada em item. Normalmente, esses cálculos levam mais tempo para fazer, e pode precisar de ser calculado com mais frequência do que os utilizados na abordagem baseada em item. Isso é porque
Você teria muito mais usuários do que itens (idealmente de qualquer maneira).
Você esperaria itens para mudar menos frequência do que os usuários.
Com mais usuários e menos mudanças nos itens oferecidos, você pode usar muitos mais atributos do que apenas compram história ao calcular similaridade usuário.
Um sistema baseado no usuário também pode usar algoritmos de aprendizado de máquina para agrupar todos os usuários que têm mostrado que eles têm os mesmos gostos. O sistema baseia-se bairros de usuários que têm perfis semelhantes, padrões de compra, ou padrões de classificação. Se uma pessoa em um bairro compra e gosta de um item, o sistema de recomendação pode recomendar esse item para todo o resto do bairro.
Tal como acontece com a filtragem colaborativa baseada em item, a abordagem baseada no usuário requer dados suficientes sobre cada usuário para ser eficaz. Antes que o sistema pode fazer recomendações, é necessário criar um perfil de usuário - por isso também exige que o usuário criar uma conta e estar conectado (ou armazenar informações sessão no navegador através de cookies) durante a visualização de um site.
Inicialmente, o sistema pode pedir que o usuário explicitamente para criar um perfil, detalhar o perfil por fazer perguntas e, em seguida, otimizar suas sugestões após dados de compra do usuário acumulou.
Netflix é um exemplo de construção de um perfil rapidamente para cada cliente. Aqui é o procedimento geral:
Netflix convida seus clientes para definir as filas dos filmes que gostariam de assistir.
Os filmes escolhidos são analisados para saber mais sobre os gostos do cliente em filmes.
O modelo preditivo recomenda mais filmes para o cliente para assistir, com base nos filmes já estavam na fila.
A matriz da amostra de clientes e seus itens comprados - é um exemplo de filtragem colaborativa baseada no usuário. Para simplificar, usar uma regra que um bairro usuário é criado a partir de usuários que compraram pelo menos duas coisas em comum.
Cliente | item 1 | ponto 2 | item 3 | item 4 | O item 5 | ponto 6 |
---|---|---|---|---|---|---|
A - N1 | x | x | x | |||
B - N1 | x | x | ||||
C - N2 | x | x | ||||
D - N2 | x | x | x | |||
E - N1 | x | x | ||||
F - N1 | x | x | x | x | ||
L - N1 | x | x | ||||
H - N3 | x | |||||
I - N3 | x |
Há três bairros de usuários formados: N1, N2, e N3. Cada usuário em bairros N1 e N2 foi comprado pelo menos 2 itens em comum com outra pessoa no mesmo bairro. N3 são usuários que ainda não preencheram os critérios e não irão receber recomendações até que comprar outros itens para atender os critérios.
Aqui está um exemplo de como você pode usar este sistema de recomendação:
off-line através de uma campanha de marketing e-mail ou se o usuário está no site enquanto estiver conectado O sistema poderia enviar anúncios de marketing ou fazer recomendações sobre o site como se segue.:
O item 3 ao Cliente B
Item 4 ao Cliente C
Ponto 1 ao Cliente E
O item 3 ao Cliente F
Número 2 a G Cliente
ponto indeterminado de clientes A e D
Idealmente, você deve ter muito mais itens do que seis. E deve sempre haver alguns itens no bairro de um cliente que o cliente não tenha comprado ainda.
ponto indeterminado para os clientes H e I
Neste caso, não há dados suficientes para servir como a base de uma recomendação.
Uma diferença muito importante é que desde que cada cliente pertence a um grupo, todas as compras futuras que um membro torna será recomendada para os outros membros do grupo até que o filtro é treinado novamente. Então cliente A e D vai começar a receber recomendações muito rapidamente, uma vez que já pertencem a um bairro e, certamente, os outros vizinhos vão comprar algo em breve.
Por exemplo: se o Cliente B compra Item 6, então o sistema de recomendação irá recomendar o item 6 a todos em N1 (Customer A, B, E, F e G).
Cliente F pode, potencialmente, pertence a nenhum N1 bairro ou N2 dependendo de como o algoritmo de filtragem colaborativa é implementado.
Clientes H e I fornecem exemplos da problema de arranque a frio: O cliente só não gerou dados suficientes para ser agrupados em um bairro usuário. Na ausência de um perfil de usuário, um novo cliente com muito pouco ou nenhum histórico de compras - ou que só compra itens obscuros - sempre colocam o problema de arranque a frio para o sistema, independentemente de qual abordagem de filtragem colaborativa está em uso.
Cliente I ilustra um aspecto do problema de arranque a frio, que é exclusivo para a abordagem baseada no usuário. A abordagem baseada em item seria começar a encontrar outros itens semelhantes para o item que o cliente bought- então, se outros usuários começar a comprar Item 6, o sistema pode começar a fazer recomendações.
Não existem outras compras precisa ser feito pelo pelo usuário a abordagem baseada em item pode começar a recomendar. Em um sistema baseado no usuário, no entanto, o Cliente I tem de fazer compras adicionais, a fim de pertencer a um bairro de usuários- o sistema não pode fazer nenhuma recomendação.
Ok, há uma suposição no trabalho nestes exemplos simples - ou seja, que o cliente não só comprou o item, mas Gostou o suficiente para fazer compras semelhantes. E se o cliente não gostou do produto? O sistema precisa de, pelo menos, para produzir uma melhor precisão nas suas recomendações.
Você pode adicionar um critério para o sistema de recomendação para agrupar pessoas que deram classificações semelhantes aos itens comprados. Se o sistema encontrar clientes que gostam e não gostam os mesmos itens, então a assunção de alta precisão é válido. Em outras palavras, existe uma alta probabilidade de que os clientes partilham os mesmos gostos.