实现lfm_LFM(latent factor model)隐语义模型核心思想-总结

LFM(latent factor model)隐语义模型核心思想是通过隐含特征联系用户兴趣和物品。

相比USerCF算法(基于类似用户进行推荐)和ItemCF(基于类似物品进行推荐)算法；我们还可以直接对物品和用户的兴趣分类。对应某个用户先得到他的兴趣分类，确定他喜欢哪一类的物品，再在这个类里挑选他可能喜欢的物品。

基于上面的思想，基于兴趣分类的方法大概需要解决3个问题：

①：如何对物品分类

②：如何确定用户对哪些物品分类，以及感兴趣的程度

③：确定了用户的兴趣，选择这个类的哪些物品推荐给用户？以及如何确定这些物品在这个类中的权重？

以图书分类为例，下面讲讲人为分类的缺点和不足：

①：编辑的分类意见不能代表各种用户的意见

②：编辑很难控制分类的粒度，何为粒度？比如《数据挖掘》这本书在粗粒度上属于计算机技术，在细粒度上属于数据挖掘。对于不同的用户需要不同的粒度。

③：编辑很难给一个物品多个类。

④：编辑很难给出多个维度的类。

⑤：编辑很难觉得一个物品在一个分类中的权重。

对于这些缺点不足，我们可以从数据出发，自动找到那些类然后进行个性化推荐。隐语义分析采取基于用户行为统计的自动聚类，较好解决了上面五个问题。

LFM通过如下公式计算用户u对物品i的兴趣：