Expertos de la UTPL diseñaron un modelo de filtrado colaborativo híbrido con los datos que registran nuestras valoraciones online, las cuales permiten promover recomendaciones de contenidos a otros usuarios con gustos similares.
Los sistemas de recomendación son un área del “aprendizaje de máquinas” o machine learning, un campo de la Inteligencia Artificial que dispone los algoritmos y técnicas de forma que un sistema aprenda, trabaje, recomiende, prediga o determine patrones y comportamientos.
Según la profesora Priscila Valdiviezo, docente del Departamento de Informática y Electrónica, Universidad Técnica Particular de Loja (UTPL), podemos entender a los sistemas de recomendación como “una herramienta que se utiliza para sugerir ítems (libros, recursos, películas, etc.) a usuarios que se encuentren registrados en un sistema. Estas recomendaciones o sugerencias pueden hacerse de diferentes formas: con base en votos, con base en contenidos, con base en perfiles de usuario (zona geográfica, demografía, edad, preferencias, entre otros, en los que se recomienda ítems con base en perfiles similares). Los sistemas de recomendación se usan en el comercio electrónico o en tiendas electrónicas”.
“En Amazon -explica la docente a modo de ejemplo- se recomiendan ítems a un usuario con base en gustos similares o según lo que haya visto con anterioridad. Otros sistemas de recomendación trabajan con base en likes o con escalas del uno al cinco que evalúan cuánto ha gustado a un usuario el ítem y, a partir de una evaluación positiva, se le recomienda un objeto similar. Netflix recomienda películas y series con sistemas de este tipo. La clave de los sistemas de recomendación es tener gran cantidad de información histórica para que el sistema pueda aprender de datos anteriores y así hacer una mejor sugerencia”.
La profesora Valdiviezo es experta en la materia. Junto a Fernando Ortega, de la Universidad Politécnica de Madrid, y Diego Rojo, del Centro Universitario de Tecnología y Arte Digital (Madrid), firma un artículo de investigación en el que se propone un método híbrido novedoso que fusiona las recomendaciones proporcionadas por diferentes enfoques de lo que se denomina “filtrado colaborativo” basado sobre un algoritmo de clasificación múltiple que se realiza en función del comportamiento de calificación de los usuarios.
En los sistemas de recomendación se necesita técnicas de filtrado de la información para determinar cuál puede ser útil o relevante para un usuario y descartar la que no lo es. Estas técnicas de filtrado pueden ser colaborativas o basadas en contenido.
“El filtrado colaborativo -resume la profesora Valdiviezo- trabaja en función de de los gustos similares de otros usuarios (por eso es colaborativo) y, por tanto, hace recomendaciones de acuerdo con la similitud de ciertos usuarios o de los ítems y necesariamente trabaja con votos: likes o escalas de votación. Por ejemplo, hay bibliotecas que piden al usuario que califique un libro en una escala y, si la evaluación es positiva, luego se le puede recomendar un libro similar que aún no ha sido votado”.
La investigación se centró en lo que denominaron “filtrado colaborativo híbrido” porque combina varias técnicas. “Como es colaborativo, trabaja con votos, pero en los votos se encuentran ciertos comportamientos (del usuario): el voto puede tener ciertos sesgos, o puede obtenerse de ellos la variedad o la desviación ponderada de un usuario con respecto a otros, etc. Entonces, se combinan varias técnicas de Inteligencia Artificial en un solo modelo, además de extracción de parámetros estadísticos o comportamientos del voto. Por eso se le llama híbrido”, explica la docente.
El modelo que aplicaron en la investigación se validó con datasets (conjunto de datos) especiales para la investigación en Inteligencia Artificial. Las bases de datos que tomaron para probar su modelo o sistema de recomendación híbrido fueron validadas con Netflix y con un conjunto de datos de venta de libros: recomendadores de películas y libros. “Estas bases de datos tienen miles de usuarios e ítems y, dependiendo de la técnica que se esté usando, debe elegirse el conjunto de datos o variables que valide a la técnica o modelo” -según Priscila Valdiviezo. En el caso de la investigación, se trabajó con usuario, película y votos, aunque en otros casos también se usa datasets sobre el contenido (género de la película y otros metadatos).
El hallazgo de la investigación es que la técnica de combinar varios comportamientos del voto permite mejorar los resultados de otros algoritmos de Inteligencia Artificial “recomendadores”. Los buenos resultados obtenidos sustentan la posibilidad de aplicar el modelo de la investigación a sistemas de esa índole para clientes o usuarios porque “un sistema se evalúa en cuanto a la calidad de la predicción y con bases en la calidad de la recomendación que se da al usuario. Nuestra investigación evidencia que se encontró una buena precisión de predicción y de la recomendación”, añade la investigadora.
El sistema de filtrado colaborativo con combinaciones híbridas que aporta la investigación también restringe en parte los ataques maliciosos (el spam, por ejemplo) que desestabilizan al sistema de recomendación. Aunque el caso de estudio que se relata en el artículo fue la sugerencia de películas y libros, el algoritmo puede cambiarse para que los ítems sean otros y, por tanto, el sistema se pueda aplicar a otro dominio. Su aplicación sería de utilidad en diversos ámbitos de diferentes áreas.
La novedad es hacer un filtrado colaborativo híbrido que combine varias técnicas. Los resultados se pueden aplicar a múltiples ámbitos: Medicina, Marketing, Turismo, Transporte, redes sociales…
Según las explicaciones de la profesora Valdiviezo, los sistemas de recomendación son de utilidad, por ejemplo, “en la sugerencia de fármacos o tratamientos con filtrado colaborativo (un caso es a través del historial de votaciones de los médicos en las que expresarán qué tan bien le hizo cada medicamento al paciente), o en educación (a los estudiantes asignados a un curso online se les puede recomendar qué foro o hilo de discusión puede visitar con base en sus preferencias, historial o actividad de otros estudiantes)”. También son de utilidad en e-commerce, Marketing, Turismo, transporte, identificación y recomendación de tendencias en redes sociales, como definir categorías de hashtags. “Investigamos el machine learning aplicado a los sistemas de recomendación y esto puede aplicarse en cualquier otra área donde se requiera”, concluye.
Este reportaje forma parte de la Revista Perspectivas de Investigación, edición #55, correspondiente a los meses octubre-noviembre 2020. Si quieres acceder a la revista completa clic aquí.