A dissertação de Mestrado de Camila Sundermann, colaboradora da Itera, buscou explorar técnicas de Mineração de Texto para Recomendação Contextual.

Hoje em dia temos uma variedade muito grande de produtos, serviços e informações disponíveis online. No geral, os usuários desfrutam de liberdade para encontrar e escolher o melhor produto/serviço disponível. Desta forma, o que seria considerado uma vantagem se não fosse pela dificuldade encontrada em escolher um produto ou serviço que mais atenda às necessidades dentro do grande conjunto de opções disponíveis.

O que é Recomendação Contextual?

A recomendação contextual tem o objetivo de ajudar usuários online a encontrarem itens de interesse em um conjunto de opções. Seja o produto ou serviço mais adequado, considerando o contexto desses usuários. 

A maioria das abordagens de sistemas de recomendação foca em recomendar itens mais relevantes para usuários individuais, não levando em consideração o contexto dos usuários. Todavia, em muitas aplicações é importante também considerar informações contextuais para fazer as recomendações. 

Como a Mineração de Texto para Recomendação Contextual funciona?

Na aplicação de técnicas de mineração de texto é importante considerar informações contextuais para fazer as recomendações. Por exemplo, um usuário pode desejar assistir um filme com os seus amigos durante um dia de semana, uma provedora de filmes via streaming na Web pode recomendar diferentes tipos de filmes para este usuário dependendo do contexto no qual este se encontra.

Um grande desafio para o uso de sistemas de recomendação sensíveis ao contexto é a falta de métodos para aquisição automática de informação contextual para estes sistemas.

Diante desse cenário, foi proposto um método para extrair informações contextuais do conteúdo de páginas Web que consiste em construir hierarquias de tópicos do conteúdo textual das páginas considerando. Além dos termos simples extraídos dos textos (informação técnica), também informações mais valiosas como entidades nomeadas e termos do domínio (informação privilegiada).

Enfim, os tópicos extraídos das hierarquias das páginas Web são utilizados como informações de contexto em sistemas de recomendação sensíveis ao contexto. Entretanto, foram realizados experimentos para avaliação do contexto extraído pelo método proposto em que foram considerados dois baselines: um sistema de recomendação que não considera informação de contexto e um método da literatura de extração de contexto implementado e adaptado para este mestrado. Além disso, foram utilizadas duas bases de dados. Ademais, os resultados obtidos foram, de forma geral, muito bons apresentando ganhos significativos sobre o baseline sem contexto. Mas, com relação ao baseline que extrai informação contextual, o método proposto se mostrou equivalente ou melhor que o mesmo.