Máquina de fatoração atencional com revisão
Scientific Reports volume 13, Artigo número: 13454 (2023) Citar este artigo
278 acessos
1 Altmétrico
Detalhes das métricas
Nos sistemas de recomendação, as avaliações dos usuários sobre os itens contêm informações semânticas ricas, que podem expressar as preferências dos usuários e as características dos itens. No entanto, os métodos de recomendação existentes baseados em revisão usam o modelo de vetor de palavras estáticas ou não conseguem extrair com eficácia recursos de sequência longa em revisões, resultando na capacidade limitada de expressão de recursos do usuário. Além disso, o impacto de interações de recursos diferentes ou inúteis entre usuários e itens no desempenho da recomendação é ignorado. Portanto, propomos uma máquina de fatoração atencional com interação usuário-item baseada em revisão para recomendação (AFMRUI), que primeiro aproveita RoBERTa para obter o recurso de incorporação de cada revisão de usuário/item e combina unidades recorrentes bidirecionais com rede de atenção para destacar mais informações úteis nas análises de usuários e de itens. Em seguida, adotamos o AFM para aprender as interações entre recursos do item e do usuário para distinguir a importância das diferentes interações entre recursos do item e do usuário e, ainda, para obter uma previsão de classificação mais precisa, de modo a promover a recomendação. Por fim, conduzimos avaliações de desempenho em cinco conjuntos de dados do mundo real. Resultados experimentais em cinco conjuntos de dados demonstraram que o AFMRUI proposto superou os métodos baseados em revisão de última geração em relação a duas métricas de avaliação comumente usadas.
Com o rápido desenvolvimento da indústria da Internet e da tecnologia de big data, os sistemas de recomendação estão a desempenhar um papel cada vez mais importante nas redes sociais1, na educação académica2, no comércio eletrónico3, e assim por diante. Hoje em dia, os sistemas de recomendação tornaram-se uma parte indispensável da vida diária, como compras online4, recomendação do próximo ponto de interesse5, recomendação de música6 e envio de vídeo7. De acordo com os dados comportamentais históricos dos usuários, os sistemas de recomendação podem prever as classificações dos itens pelos usuários e realizar recomendações personalizadas, de modo a ajudar os usuários a descobrir rapidamente os itens nos quais estão interessados e melhorar a satisfação dos usuários. Portanto, a fim de fornecer melhores serviços de recomendação personalizados, como prever com precisão as classificações dos usuários sobre os itens para aumentar a recomendação torna-se um problema desafiador.
Para resolver o problema acima, os pesquisadores propuseram uma variedade de métodos de previsão de classificação de itens, entre os quais o método de previsão de classificação8 baseado em filtragem colaborativa (CF) é um dos métodos mais amplamente utilizados. A maioria dos métodos de FC baseia-se na fatoração de matrizes9,10, aprendendo características latentes de usuários e itens de modelos matriciais para recomendação. Considerando que as classificações dos usuários para os itens refletem seus comportamentos de interação e características explícitas, Zhang et al.11 obtiveram características dos usuários e dos itens a partir de informações de classificação do usuário-item com base na fatoração profunda da matriz. No entanto, com o rápido crescimento do número de usuários e itens, há cada vez mais problemas, como a dispersão dos dados de classificação. Infelizmente, as informações extraídas dos dados de classificação são limitadas, restringindo consequentemente o desempenho da recomendação.
Em comparação com os dados de classificação, as informações de revisão contêm uma semântica rica, que pode não apenas refletir a satisfação dos usuários com a qualidade e função do item, mas também expressar indiretamente as preferências dos usuários e as características do item12. Assim, a previsão de classificação de itens baseada em revisão atraiu grande atenção de pesquisadores, como ConvMF13, DeepCoNN14, D-Attn15, NARRE16 e DAML17, etc. classificações de previsão relativamente precisas para recomendação. No entanto, existem duas limitações principais, como segue:
A capacidade de expressão dos recursos do usuário/item é insuficiente. Na pesquisa acima, D-Attn15, DAML17, etc., aproveitam vetores de palavras codificados estaticamente, como word2vec ou Glove, resultando em representação esparsa de recursos, semântica insuficiente e polissemia, que afetam a capacidade do modelo de extrair recursos de usuários e itens. Além disso, modelos como ConvMF13, DeepCoNN14 e NARRE16 usam redes neurais convolucionais (CNN) para extrair recursos de usuários e itens de revisões, que não conseguem extrair com eficácia recursos de texto de sequência longa em revisões e, portanto, não podem expressar com precisão recursos de usuários ou itens, limitando o desempenho do modelo.