LFM(latent factor model)隐语义模型核心思想是通过隐含特征联系用户兴趣和物品。
相比USerCF算法(基于类似用户进行推荐)和ItemCF(基于类似物品进行推荐)算法;我们还可以直接对物品和用户的兴趣分类。对应某个用户先得到他的兴趣分类,确定他喜欢哪一类的物品,再在这个类里挑选他可能喜欢的物品。
基于上面的思想,基于兴趣分类的方法大概需要解决3个问题:
①:如何对物品分类
②:如何确定用户对哪些物品分类,以及感兴趣的程度
③:确定了用户的兴趣,选择这个类的哪些物品推荐给用户?以及如何确定这些物品在这个类中的权重?
以图书分类为例,下面讲讲人为分类的缺点和不足:
①:编辑的分类意见不能代表各种用户的意见
②:编辑很难控制分类的粒度,何为粒度?比如《数据挖掘》这本书在粗粒度上属于计算机技术,在细粒度上属于数据挖掘。对于不同的用户需要不同的粒度。
③:编辑很难给一个物品多个类。
④:编辑很难给出多个维度的类。
⑤:编辑很难觉得一个物品在一个分类中的权重。
对于这些缺点不足,我们可以从数据出发,自动找到那些类然后进行个性化推荐。隐语义分析采取基于用户行为统计的自动聚类,较好解决了上面五个问题。
LFM通过如下公式计算用户u对物品i的兴趣:
版权声明:本文为weixin_29663861原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。