Conforme os visitantes do site navegam na Internet, eles deixam uma grande quantidade de dados comportamentais, como páginas visitadas, o que clicaram e o que compartilharam nas redes sociais. Por meio de testes, comparamos diferentes algoritmos e encontramos maneiras de descobrir quais anúncios têm a maior probabilidade de serem clicados.

Pense naquela época em que amigos recomendavam um filme para você no fim de semana. As dicas deles são baseadas no que eles sabem que você gosta, do que eles gostam e na suposição subjacente de sua semelhança mútua ou no contexto atual de sua conversa?

Hoje, em quase todos os destinos online, de lojas de comércio eletrônico a cinemas online e plataformas sociais, existem sistemas de recomendação cujo trabalho é observar o comportamento do usuário em segundo plano e sugerir itens com os quais eles têm maior probabilidade de se engajar.

Todos os gigantes online estão se esforçando para fornecer as recomendações mais relevantes e personalizadas para seus usuários. Neste artigo, você terá uma visão geral dos diferentes tipos de sistemas de recomendação, algoritmos de filtragem e como funciona o mecanismo de recomendação de conteúdo MGID.

O que é um mecanismo de recomendação de conteúdo?

Os sistemas de recomendação de conteúdo fornecem observações do comportamento de um usuário e prevêem a quais outras coisas o mesmo usuário responderá. Essencialmente, eles ajudam a criar experiências personalizadas que dão a sensação de um amigo que conhece você, do que você gosta, do que os outros gostam e entende quais opções existem para você.

Cliques, compras, visualizações, comportamento de leitura ou outras ações do usuário podem ser representados graficamente como conexões entre os usuários de um lado e o conteúdo ou itens do outro. Cada linha significa que um usuário comprou, visualizou ou clicou em um determinado item. Em alguns sistemas, essas conexões podem variar em sua intensidade; por exemplo, eles podem identificar o número de vezes que um item foi comprado ou a avaliação do filme em uma escala de 1 a 10. Assim, o problema é identificar quais outras linhas desconhecidas podem ser adicionadas a este gráfico e prever sua força.

Existem dois tipos diferentes de sistemas de recomendação, aqueles baseados no item ou na filtragem do usuário. Os algoritmos de filtragem com base no usuário são bastante diretos; eles simplesmente escolhem outros usuários com interesses ou padrões de comportamento semelhantes, analisam quais itens foram escolhidos por esses usuários semelhantes e os sugerem a um novo usuário.

Em vez disso, algoritmos baseados em item procuram itens relacionados em todo o catálogo. Aqui, o termo "relacionado" deve ser determinado caso a caso. Freqüentemente, isso significa que o item A foi escolhido (comprado, clicado, assistido etc.) com uma frequência incomumente alta por usuários que também escolheram o item B (o item relacionado).

A história dos mecanismos de recomendação

Em 1998, quando ainda eram principalmente uma livraria, a Amazon havia lançado um mecanismo de recomendação item a item muito simples. Seu primeiro algoritmo era baseado em filtragem colaborativa e sugeria novos itens para compra com base no que o usuário já tinha no carrinho de compras. Esse recurso foi muito bem recebido pelos usuários e, desde então, os sistemas de recomendação ganharam popularidade na web.

Em 2003, a Amazon e outras grandes operadoras de comércio eletrônico sofisticaram esse recurso: passou a fornecer recomendações com base nas compras anteriores do usuário e nos itens navegados na loja. As páginas de resultados da pesquisa tinham um algoritmo diferente que apresentava itens mais relacionados à pesquisa. Mais páginas tinham pelo menos algum conteúdo recomendado, incluindo páginas de navegação, páginas de detalhes de produtos e outros. Naquela época, cerca de 30% de todas as visualizações de página na Amazon vinham do sistema de recomendação.

Em seguida, os usuários online de entretenimento, viagens e outros nichos também começaram a usar algoritmos de recomendação. Netflix usou esse recurso tão amplamente que, em 2006, anunciou uma competição de ML para o problema de previsão de classificação de filmes , o Prêmio Netflix. Eles ofereceram US $ 1 milhão para melhorar a precisão de seu sistema de recomendação de filmes. Diferentes soluções e algoritmos foram avaliados com base em como eles podem minimizar o erro quadrático médio (RMSE) da classificação prevista, com a redução de 10% definida como uma meta.

Por fim, na década de 2010, os editores digitais e sites de notícias também começaram a usar recomendações de conteúdo para descobrir, sugerindo artigos adicionais aos visitantes com base em seu comportamento ou interesses no local. Esses artigos recomendados podem levar a conteúdo do mesmo site ou a outros sites, mostrar conteúdo de vídeo ou apresentar em outros formatos da web.

As recomendações no site podem aumentar o envolvimento do usuário com o site do editor e diminuir as taxas de rejeição, enquanto as recomendações fora do site são usadas para promover projetos de conteúdo externo, anunciar produtos e gerar leads.

Hoje, os editores adicionam recomendações de descoberta de conteúdo de várias maneiras, de plug-ins simples a plataformas dedicadas com diversas funcionalidades. Um exemplo é a plataforma MGID, que foi a primeira a oferecer widgets de recomendação de conteúdo, o formato mais popular hoje.

Alguns dos mecanismos de recomendação (principalmente plug-ins) são baseados na análise de palavras-chave e tags para sugerir conteúdo semelhante ao que o usuário está consumindo atualmente. Outros investigam o comportamento do usuário, como eles se envolvem com diferentes conteúdos, seus interesses e dados demográficos sociais para fornecer recomendações.

Filtragem colaborativa vs baseada em conteúdo

Existem duas abordagens gerais para construir algoritmos de recomendação: filtragem baseada em conteúdo e filtragem colaborativa.

A filtragem baseada em conteúdo rotula cada item ou usuário com certas características e, em seguida, analisa esses recursos, fazendo suposições sobre sua semelhança. É preciso conhecer muito bem os produtos ou o público-alvo para fazer suposições sobre eles. Por exemplo, o mecanismo de recomendação deve saber o gênero específico dos filmes, seu país de origem, diretor, data de lançamento, etc. para concluir que são semelhantes e recomendar um quando um usuário manifestar interesse em outro.

Em contraste com a filtragem de conteúdo, os sistemas colaborativos não exigem um conhecimento profundo do produto ou uma categorização extensa, pois analisam o comportamento real do usuário. Os recursos ou características são extraídos diretamente dos dados históricos sobre interações anteriores entre usuários e itens. O motor desenvolve uma matriz gigante com usuários e itens e identifica clusters comuns para fazer sugestões. Além disso, métricas de distância adequadas podem ser usadas para fatoração de matriz.

Assim, os sistemas de recomendação colaborativos podem ser diferenciados em dois tipos diferentes:

  • filtragem baseada em memória

Esses sistemas procuram a similaridade item a item ou usuário a usuário. Basicamente, ele faz recomendações com base em quem comprou (ou visualizou, clicou, etc.) o produto A também comprou o produto B. Os sistemas baseados em memória podem ser muito precisos, mas exigem cluster multidimensional e são difíceis de escalar.

  • filtragem baseada em modelo

Aqui, o algoritmo é baseado na fatoração de matriz: você deve atribuir um certo número de recursos (parâmetros) e pesos para esses recursos, ou seja, construir um modelo matemático para prever a similaridade dos itens. Você também deve escolher a função objetivo do modelo, por exemplo, a probabilidade de compra.

Resumindo, os modelos baseados em conteúdo podem ser usados ​​quando todos os recursos relacionados a itens e usuários são conhecidos. A filtragem colaborativa, por outro lado, distribui recomendações sem conhecimento profundo do produto ou quando há uma alta probabilidade de conclusões tendenciosas. Para fazer uso da experiência do produto disponível e evitar possíveis vieses, a filtragem híbrida pode ser usada.

Mecanismo de recomendação de conteúdo do MGID

O algoritmo do MGID seleciona anúncios nativos nos quais um usuário provavelmente pode estar interessado com base em seu comportamento anterior e no contexto atual da página. A função objetiva que o mecanismo está configurado para melhorar é a CTR (taxa de cliques) do usuário, ou seja, o sistema prevê a probabilidade de um usuário clicar em vários anúncios e mostra os anúncios com a maior probabilidade.

O algoritmo é baseado em filtragem baseada em item híbrido, ou seja, o sistema de recomendação combina dados de algoritmos baseados em conteúdo (usando as categorias de conteúdo da página da web e propaganda, demografia social, interesses do público, etc.) com comportamento- algoritmos baseados (usando visualizações de página, cliques e impressões anteriores do usuário).

A importância do interesse do usuário de curto prazo

Ao construir o sistema de recomendação, nosso objetivo foi distinguir as características ou parâmetros que podem nos ajudar a mostrar os anúncios mais relevantes e dignos de clique. Com base em uma série de experimentos e testes, determinamos que interesse de curto prazo do usuário, ou seja, observações das ações mais recentes do usuário no site, como cliques e visualizações de página, é o parâmetro mais importante que prevê quais anúncios podem ser clicados.

Por exemplo, a probabilidade de um usuário clicar no anúncio de uma determinada categoria aumenta se ele recentemente clicou em outros anúncios da mesma categoria. Usando o interesse do usuário de curto prazo como um dos principais preditores para escolher recomendações de conteúdo, fomos capazes de aumentar o CTR médio em 3,5% nas campanhas de produto e em 4,5% nas campanhas de conteúdo.

O sistema é atualizado imediatamente com base nas novas informações sobre cliques do usuário e visualizações de página. Para cada posicionamento de anúncio que faz parte do contexto da página da web e as ações recentes de um usuário no site, o mecanismo de recomendação MGID procura os anúncios mais relevantes, filtra os anúncios duplicados ou dispensados ​​e, em seguida, os anúncios são exibidos ao visitante.

A proximidade das ações observadas no tempo é importante: se um usuário tivesse clicado nos anúncios de uma determinada categoria há alguns dias, há poucas evidências de que os anúncios da mesma categoria seriam úteis para ele hoje. Por isso, identificamos e armazenamos apenas os dados recentes sobre o comportamento do usuário.

Considerações finais

Todos os gigantes online estão lutando para melhorar seus sistemas de recomendação. Por um lado, os gostos e o comportamento das pessoas nunca podem ser perfeitamente previstos porque existem tantas variáveis ​​diferentes e estão sempre em fluxo. É possível, no entanto, estimar as correspondências mais prováveis ​​e mostrar os anúncios mais relevantes usando a vasta quantidade de dados de preferência e comportamento.

Na publicidade nativa, o mecanismo de recomendação atua como um terceiro que equilibra os interesses dos usuários com as configurações dos editores e a segmentação dos anunciantes. Dessa forma, as recomendações de conteúdo nativo podem aumentar o engajamento do leitor, além de trazer mais conversões e vendas.

Agora que cobrimos os fundamentos de como os sistemas de recomendação de conteúdo funcionam e como o MGID o faz, te convidamos a entrar em contato conosco e descobrir como a plataforma MGID pode ajudar seu negócio online.