Aprendizaje de máquinas: ¿Cómo se recomienda el contenido en medios digitales?

Los algoritmos que gobiernan las recomendaciones en los medios digitales son usados cada vez más y en dominios cada vez más heterogéneos. Hablemos sobre estos sistemas de recomendación y sobre las investigaciones que continuamente los optimizan para predecir el comportamiento de un usuario.

LOS SISTEMAS DE RECOMENDACIÓN ELECTRÓNICOS UTILIZAN LA INTELIGENCIA ARTIFICIAL

UBICUIDAD DE LOS SISTEMAS DE RECOMENDACIÓN

Cuando navegamos en Internet, independientemente del tipo de plataforma en la que estemos, buena parte del contenido que vemos en nuestras pantallas es filtrado y categorizado. La forma en la que el contenido se sirve a los usuarios no es arbitraria, sino que responde a un ‘sistema de recomendación’.

Sitios web de ‘streaming’ como Netflix usan ampliamente sistemas de recomendación para emparejar a un usuario con cierto contenido de video. Sitios de comercio digital como Amazon también usan estos sistemas para recomendar ítems que a un usuario podrían interesar. Redes sociales y motores de búsqueda de todo tipo usan recomendaciones para ordenar el contenido que se muestra a cierto perfil de usuario. En fin, los sistemas de recomendación son ampliamente aplicados en la sugerencia de ‘ítems’ a usuarios. Ítems tan variados que van desde libros para compradores y películas para subscriptores de servicios web, hasta hoteles en sitios turísticos y rutas para conductores de vehículos.

Ahora, ¿de dónde vienen estos sistemas y en qué contexto se han desarrollado? Debido a su función de filtrado de contenido que debe aprender continuamente del comportamiento de usuarios, los sistemas de recomendación son una rama del ‘aprendizaje de máquinas’ o ‘machine learning’. A su vez, las técnicas del aprendizaje de máquinas son un campo de la inteligencia artificial que pretende que un sistema prediga, recomiende, aprenda o determine patrones y comportamientos.

Entonces, la clave de los sistemas de recomendación es contar con una gran cantidad de información histórica, o bases de datos, para que el sistema aprenda y recomiende ítems óptimamente.

¿CÓMO FILTRAN EL CONTENIDO LOS SISTEMAS DE RECOMENDACIÓN? 

En los medios digitales, y en cualquier otra tecnología que emplee sistemas de recomendación, las sugerencias pueden basarse en contenido o ser colaborativas. Esto quiere decir que la manera en la que se filtra la información se fundamenta en los contenidos de los ítems que se quiere recomendar o en los perfiles de los usuarios a los que se recomienda.

Para ilustrar ambos tipos de recomendación, pensemos en un sitio web como YouTube. Por un lado, las sugerencias de video que recibimos están basadas en el contenido en sí: fecha de publicación, extensión y género del video, restricciones de edad, etc. Por otro lado, el algoritmo de recomendación también toma en cuenta el perfil y la actividad del usuario: sus preferencias y la afinidad de éstas con las de otros usuarios que han dado ‘me gusta’ a cierto contenido.

Las recomendaciones colaborativas, por tanto, toman en cuenta el perfil de un usuario y su relación con otros perfiles. Ítems similares se recomendarán a usuarios de edad, preferencias o zonas geográficas similares. Como estos filtros trabajan en base a la actividad de usuarios que evalúan el contenido, se les denomina también sistemas ‘en base a votos’. Por ejemplo, existen bibliotecas virtuales en las que se pide al usuario que califique los títulos que ha leído para luego priorizar la recomendación de libros a cierta demografía que comparta características.

FILTRADO COLABORATIVO HÍBRIDO: MEJORAMIENTO DE SISTEMAS DE RECOMENDACIÓN

Existe toda una gama de técnicas y modelos de recomendación, que además están en constante cambio. Debido a esta variabilidad y a la gran importancia de estos sistemas de aprendizaje de máquinas, es necesario realizar investigación científica en este campo para optimizar la predicción de estos algoritmos. Priscila Valdiviezo, del Departamento de Ciencias de la Computación y Electrónica de la UTPL, es una de las investigadoras de inteligencia artificial que buscan precisamente esa optimización.

En su investigación, Priscila trabaja con sistemas en base a votos que denomina “filtrado colaborativo híbrido” (FCH). El modelo de filtrado colaborativo, que desarrolló junto con investigadores del Centro Universitario de Tecnología y Arte Digital en Madrid, se categoriza como ‘híbrido’ porque toma en cuenta diversos aspectos en los votos de los usuarios para efectuar las recomendaciones. El modelo combina varias técnicas de inteligencia artificial y extrae parámetros estadísticos de los votos, que interpretan el comportamiento de un perfil, para introducir aspectos como el sesgo del usuario.

Los investigadores encontraron que con su modelo de FCH podían mejorar los resultados de predicción al sugerir ítems, en comparación con otros algoritmos no híbridos. El modelo fue validado con bases de datos de una plataforma de venta de libros y de Netflix; bases que son usadas para investigación en inteligencia artificial. Además de presentar predicciones precisas a la hora de recomendar, el modelo de FCH también restringe ataques maliciosos que desestabilizan a los sistemas de recomendación, como el ‘spam’.

OTRAS APLICACIONES IMPORTANTES

Priscila nos ha comentado que su estudio sobre el aprendizaje de máquinas aplicado a sistemas de recomendación pretende ir más allá de las aplicaciones en el comercio electrónico, marketing, turismo o redes sociales. Espera que esta línea investigación también pueda emplearse en otros dominios: medicina y educación, por ejemplo.

En medicina, un sistema de recomendación podría sugerir un tratamiento basado en un historial de votaciones por profesionales de la salud. Dichas votaciones responderían, en una escala, a la pregunta: ¿qué tan bien sentó a un paciente cierto tratamiento o fármaco? Luego, por medio de filtrado colaborativo de estas bases de datos, y en función de los síntomas del paciente, el sistema recomendaría el tratamiento, o uso de fármacos, óptimo.

Así mismo, se pueden considerar aplicaciones en la educación, cuando ésta se imparte en entornos virtuales. Recomendar a los estudiantes qué foros o hilos de discusión deberían visitar es relevante para la optimización de su tiempo y la calidad de contenido que reciben en estas plataformas. Esto puede hacerse en base a las preferencias e historial de actividad del estudiante y a la actividad de otros estudiantes de perfil similar.