Como usar filtros colaborativa baseada item em Análise Preditiva

Um dos sistemas de recomendação da Amazon para usos análise preditiva filtragem colaborativa baseada em produto - distribuindo um estoque enorme de produtos do banco de dados da empresa quando um usuário visualiza um único item no site. Você sabe que você está olhando para um sistema baseado em item de filtragem colaborativa (ou, muitas vezes, um sistema baseado em conteúdo) se mostra recomendações em sua primeira tela do item, mesmo se você não tiver criado um perfil.

Parece mágica, mas não é. Apesar de seu perfil não foi criado ainda (porque você não está logado ou você não tem nenhum histórico anterior do navegador no site) o sistema leva o que equivale a um palpite: Ele baseia a sua recomendação sobre o item em si e o que outros clientes visualizados ou comprados depois (ou antes) eles compraram esse item. Então você vai ver alguma mensagem na tela como

  • Clientes que compraram este item, também compraram . . .

  • Clientes que compraram itens em sua história recente também compraram. . .

  • Que outros itens que os clientes compram depois de ver este item?

Em essência, a recomendação é baseada em como semelhante o item actualmente visualizado é a outros itens, com base nas ações da comunidade de usuários.

A seguir mostra uma matriz de amostra de clientes e os itens comprados. Será utilizado como um exemplo de filtragem colaborativa à base de produto.

Clienteitem 1ponto 2item 3item 4O item 5ponto 6
UMAxxx
Bxx
Cxx
Dxxx
Exx
Fxxxx
Gxx
Hx
Eux

Agora vamos olhar para similaridade item calculado por meio da fórmula de co-seno similaridade. A fórmula para cosseno de similaridade é uma middot- B) / (A || || || || B), em que A e B são produto para comparar. Para ler o exemplo a seguir e descubra como semelhante um par de itens são, apenas localizar a célula onde os dois itens se cruzam. O número será entre 0 e 1. Um valor de 1 significa que os artigos são perfeitamente similaridade 0 significa que eles não são semelhantes.

ponto 600000
O item 50,260,290,520,820
item 40,320,350,320,820
item 30,400,450,320,520
ponto 20,670,450,350,290
item 10,670,400,320,260
item 1ponto 2item 3item 4O item 5ponto 6

O sistema pode fornecer uma lista de recomendações que estão acima de um certo valor semelhança ou pode recomendar o topo n número de ítens. Neste cenário, você pode dizer que qualquer valor superior ou igual a 0,40 é similaridade o sistema irá recomendar esses itens.

Por exemplo, a semelhança entre o item 1 e número 2 é 0,67. A semelhança entre o produto 2 e o item 1 é o mesmo. Assim, é uma imagem espelhada do outro lado da diagonal de inferior esquerdo para canto superior direito. Você também pode ver que o ponto 6 não é semelhante a todos os outros artigos, porque tem um valor de 0.

Esta implementação de um sistema de recomendação com base em item é simplificado para ilustrar como funciona. Para simplificar, usar apenas um critério para determinar a similaridade artigo: se o usuário comprou o item. Mais sistemas complexos poderiam entrar em maiores detalhes por

  • Usando perfis criados pelos utilizadores que representam seus gostos

  • Factoring em quanto s usuário gosta (ou altamente taxas) em um item

  • Pesando o número de itens comprados pelo usuário que são semelhantes ao potencial item recomendado (s)

  • Fazer suposições sobre se um usuário gosta de um item com base em se o usuário simplesmente visto o item, mesmo que nenhuma compra foi feita

Aqui estão duas maneiras comuns que você pode usar este sistema de recomendação:

  • Off-line através de uma campanha de marketing e-mail ou se o usuário está no site enquanto estiver conectado.

    O sistema poderia enviar anúncios de marketing ou fazer estas recomendações sobre o site:

  • O item 3 ao Cliente B

    Recomendado porque Cliente B comprado itens 1 e 2, e ambos os itens são semelhantes ao Item 3.

  • Item 4, em seguida, Item 2, para o Cliente C

    Recomendado porque Cliente C comprados itens 3 e 5. O item 5 é semelhante ao Item (valor de similaridade: 0,82) 4. Ponto 2 é semelhante ao Item (valor de similaridade: 0,45) 3.

  • Ponto 2 ao Cliente D

    Recomendado porque Cliente D comprado itens 3, 4 e 5. O ponto 3 é semelhante ao ponto 2.

  • Ponto 1 ao Cliente E

    Recomendado porque Cliente E Itens comprados 2 e 3, sendo que ambos são semelhantes ao Item 1.

  • O item 3 ao Cliente F

    Recomendado porque Cliente F comprada Itens 1, 2, 4 e 5. Itens 1, 2 e 5 são semelhantes ao Item 3.

  • Número 2 a G Cliente

    Recomendado porque Cliente G comprado itens 1 e 3. Eles são ambos semelhante ao ponto 2.

  • Item 2, em seguida, Item 3, para o Cliente H

    Recomendado porque Cliente H comprou o item 1. Item 1 é semelhante aos itens 2 e 3.

  • ponto indeterminado ao Cliente A

    Idealmente, você deve ter muito mais itens e usuários. E deve haver alguns itens que um cliente comprou que são semelhantes a outros itens que ele ou ela ainda não adquiridos.

  • ponto indeterminado ao Cliente I

    Neste caso, os dados são insuficientes para servir como base de uma recomendação. Este é um exemplo do problema de arranque a frio.

  • On-line através de uma visualização de página quando o usuário não está logado.

  • menu