A medida que los visitantes del sitio web navegan por Internet, dejan grandes cantidades de datos de comportamiento, como las páginas visitadas, en qué hicieron clic y lo que compartieron en las redes sociales. A través de pruebas, comparamos diferentes algoritmos y encontramos formas de averiguar qué anuncios tienen la mayor probabilidad de que se haga clic en ellos.
Piense en ese momento en que sus amigos le recomendaron una película para el fin de semana. ¿Sus consejos se basan en lo que saben que le gusta a usted, lo que les gusta a ellos y la suposición subyacente de su similitud mutua, o el contexto actual de su conversación?
Hoy en día, en casi todos los destinos en línea, desde tiendas de comercio electrónico hasta cines en línea y plataformas sociales, existen sistemas de recomendación cuyo trabajo es observar el comportamiento del usuario desde la trastienda y sugerir elementos con los que es más probable que interactúe.
Todos los gigantes en línea se esfuerzan por mejorar al brindar las recomendaciones más relevantes y personalizadas a sus usuarios. En este artículo, obtendrá un adelanto de los diferentes tipos de sistemas de recomendación, algoritmos de filtrado y cómo funciona el motor de recomendación del contenido MGID.
¿Qué es un motor de recomendación de contenido?
Los sistemas de recomendación de contenido brindan observaciones del comportamiento de un usuario y predicen a qué otras cosas responderá el mismo usuario. Esencialmente, ayudan a crear experiencias personalizadas que se sienten como un amigo que lo conoce, sabe lo que le gusta, lo que les gusta a los demás y comprende las opciones que existen para usted.
Los clics, compras, vistas, comportamiento de lectura u otras acciones de los usuarios se pueden representar gráficamente como conexiones entre los usuarios de un lado y el contenido o los elementos del otro. Cada línea significa que un usuario compró, vio o hizo clic en un elemento en particular. En algunos sistemas, estas conexiones pueden variar en su fuerza; por ejemplo, pueden identificar la cantidad de veces que se compró un artículo o la calificación de la película en una escala del 1 al 10. Por lo tanto, el problema es identificar qué otras líneas desconocidas se pueden agregar a este gráfico y predecir su fuerza.
Hay dos tipos diferentes de sistemas de recomendación, basados en el artículo o en el filtrado de usuarios. Los algoritmos de filtrado basados en el usuario son bastante sencillos; simplemente eligen a otros usuarios con intereses o patrones de comportamiento similares, luego analizan qué elementos eligieron esos usuarios similares y se los sugieren a un nuevo usuario.
En cambio los algoritmos basados en artículos buscan artículos relacionados en todo el catálogo. Aquí, el término "relacionado" debe determinarse caso por caso. A menudo, significa que el elemento A fue elegido (comprado, hecho clic, visto, etc.) con una frecuencia inusualmente alta por parte de los usuarios que también eligieron el elemento B (el elemento relacionado).
La historia de los motores de recomendación
En 1998, cuando todavía eran principalmente una librería, Amazon lanzó un motor de recomendación de artículo a artículo muy simple. Su primer algoritmo se basó en el filtrado colaborativo y sugirió nuevos artículos para la compra en función de lo que el usuario ya tenía en el carrito de compras. Esta función ha sido muy bien recibida por los usuarios y, desde entonces, los sistemas de recomendación han ganado popularidad en la web.
En 2003, Amazon y otros grandes operadores de comercio electrónico habían sofisticado esta función: ahora proporcionaban recomendaciones basadas en las compras anteriores de un usuario y los artículos consultados en la tienda. Las páginas de resultados de búsqueda tenían un algoritmo diferente que presentaba elementos más relacionados con la búsqueda. Más páginas tenían al menos algún contenido recomendado, incluidas páginas de navegación, páginas de detalles de productos y otros. En ese momento, aproximadamente el 30% de todas las páginas vistas en Amazon provenían del sistema de recomendación.
Luego, los jugadores online del entretenimiento, viajes y otros nichos también comenzaron a usar algoritmos de recomendación. Netflix ha utilizado esta función tan ampliamente que en 2006 anunciaron un concurso de ML para el problema de predicción de clasificación de películas, el premio Netflix. Ofrecieron $ 1 millón para mejorar la precisión de su sistema de recomendación de películas. Se evaluaron diferentes soluciones y algoritmos en función de cómo pueden minimizar el error cuadrático medio (RMSE) de la calificación prevista, con una disminución del 10% establecida como objetivo.
Finalmente, en la década de 2010, los editores digitales y los sitios web de noticias también comenzaron a usar recomendaciones de descubrimiento de contenido, sugiriendo artículos adicionales a los visitantes en función de su comportamiento o intereses en el sitio. Estos artículos recomendados pueden llevar a contenido del mismo sitio o a otros sitios, mostrar contenido de video o obtener una vista previa de otros formatos web.
Las recomendaciones en el sitio pueden aumentar la participación del usuario con el sitio del editor y disminuir las tasas de rebote, mientras que las recomendaciones fuera del sitio se utilizan para promocionar proyectos de contenido externo, publicitar productos y generar leads.
Hoy en día, los editores agregan recomendaciones de descubrimiento de contenido de diversas formas, desde complementos simples hasta plataformas dedicadas con diversas funcionalidades. Un ejemplo es la plataforma MGID que fue la primera en ofrecer widgets de recomendación de contenido, el formato más popular en la actualidad.
Algunos de los motores de recomendación (principalmente complementos) se basan en el análisis de palabras clave y etiquetas para sugerir contenido similar al que un usuario está consumiendo actualmente. Otros investigan el comportamiento de los usuarios, cómo interactúan con los diferentes contenidos, sus intereses y la demografía social para ofrecer recomendaciones.
Filtrado colaborativo vs basado en contenido
Hay dos enfoques generales para construir algoritmos de recomendación, filtrado basado en contenido y filtrado colaborativo.
El filtrado basado en contenido etiqueta cada elemento o usuario con ciertas características y luego analiza estas características, haciendo suposiciones sobre su similitud. Usted tiene que conocer muy bien los productos o la audiencia para hacer conjeturas sobre ellos. Por ejemplo, el motor de recomendación tiene que conocer el género cinematográfico específico de las películas, su país de origen, director, fecha de estreno, etc. para concluir que son similares y recomendar una cuando un usuario expresó interés en otra.
A diferencia del filtrado de contenido, los sistemas colaborativos no requieren una gran experiencia en el producto ni una categorización extensa porque analizan el comportamiento real del usuario. Las características o cualidades se extraen directamente de los datos históricos sobre interacciones pasadas entre usuarios y elementos. El motor desarrolla una matriz gigante con usuarios y elementos e identifica grupos comunes para hacer sugerencias. Además, se pueden utilizar métricas de distancia adecuadas para la factorización matricial.
Así, los sistemas de recomendación colaborativa se pueden diferenciar en dos tipos diferentes:
filtrado basado en memoria
Estos sistemas buscan la similitud de un artículo a otro o de un usuario a otro. Básicamente, hace recomendaciones basadas en quien compró (o vio, hizo clic, etc.) en el producto A y también compró el producto B. Los sistemas basados en memoria pueden ser muy precisos, pero requieren agrupaciones multidimensionales y son difíciles de escalar.
filtrado basado en modelos
Aquí, el algoritmo se basa en la factorización matricial: debe asignar un cierto número de características (parámetros) y pesos para estas características, es decir, construir un modelo matemático para predecir la similitud de los elementos. También debe elegir la función objetivo para el modelo, por ejemplo, la probabilidad de compra.
En resumen, los modelos basados en contenido se pueden utilizar cuando se conocen todas las funciones relacionadas con los elementos y los usuarios. El filtrado colaborativo, por otro lado, distribuye recomendaciones sin una gran experiencia en el producto o cuando existe una alta probabilidad de conclusiones sesgadas. Para hacer uso de la experiencia del producto disponible y evitar posibles sesgos, se puede utilizar filtrado híbrido.
Motor de recomendación de contenido MGID
El algoritmo de MGID selecciona los anuncios nativos en los que un usuario probablemente podría estar interesado en función de su comportamiento pasado y el contexto actual de la página. La función objetivo por la cual el motor está configurado para mejorar es el CTR (tasa de clics) del usuario, es decir, el sistema predice la probabilidad de que un usuario haga clic en varios anuncios y muestra los anuncios con la mayor probabilidad.
El algoritmo se basa en el filtrado híbrido basado en elementos, es decir, el sistema de recomendación combina datos de algoritmos basados en contenido (utilizando las categorías de contenido de la página web y la publicidad, la demografía social, los intereses de la audiencia, etc.) con algoritmos basados en el comportamiento del usuario (utilizando las páginas vistas, los clics y las impresiones anteriores del usuario).
La importancia del interés de los usuarios a corto plazo
Al construir el sistema de recomendación, nuestro objetivo era distinguir las características o parámetros que pueden ayudarnos a mostrar los anuncios más relevantes y dignos de hacer clic. Basándonos en una serie de experimentos y pruebas, determinamos que el interés del usuario a corto plazo, es decir, las observaciones de las acciones más recientes del usuario en el sitio, como los clics y las páginas vistas, es el parámetro más importante que predice en qué anuncios el usuario podría hacer clic.
Por ejemplo, la probabilidad de que un usuario haga clic en el anuncio de una categoría en particular aumenta si recientemente hizo clic en otros anuncios de la misma categoría. Usando el interés de los usuarios a corto plazo como uno de los principales predictores para elegir las recomendaciones de contenido, pudimos aumentar el CTR promedio en un 3.5% en las campañas de productos y en un 4.5% en las campañas de contenido.
El sistema se actualiza inmediatamente en función de la nueva información sobre los clics de los usuarios y las páginas vistas. Para cada ubicación de anuncios que forma parte del contexto de la página web y las acciones recientes de un usuario en el sitio, el motor de recomendación MGID busca los anuncios más relevantes, filtra los anuncios duplicados o descartados y luego los anuncios se muestran al visitante.
La proximidad de las acciones observadas en el tiempo es importante: si un usuario hizo clic en anuncios de una categoría en particular, incluso hace unos días, hay poca evidencia de que los anuncios de la misma categoría sean útiles para ellos en la actualidad. Por lo tanto, identificamos y almacenamos solo los datos recientes sobre el comportamiento del usuario.
Pensamiento final
Todos los gigantes en línea luchan por mejorar en los sistemas de recomendación. Por un lado, los gustos y el comportamiento de las personas nunca pueden predecirse perfectamente porque hay muchas variables diferentes y siempre están en constante cambio. Sin embargo, es posible estimar las coincidencias más probables y mostrar los anuncios más relevantes utilizando la gran cantidad de datos de preferencias y comportamiento.
En la publicidad nativa, el motor de recomendaciones actúa como un tercero que equilibra los intereses de los usuarios con la configuración de los editores y la orientación de los anunciantes. De esta manera, las recomendaciones de contenido nativo pueden impulsar la participación del lector, así como generar más conversiones y ventas.
Ahora que cubrimos los conceptos básicos de cómo funcionan los sistemas de recomendación de contenido y cómo lo hace MGID, lo invitamos a contactarnos y descubrir cómo la plataforma MGID puede ayudar a su negocio en línea.