|
Post by raselbd296 on Dec 24, 2023 3:51:39 GMT
您还可以使用购买的产品总数或购买花费的总 平均金额而不是二进制表示法。购物向的选择将影响推荐系统的有效性并且应该在比较不同的变体之后做出。 有了购物向量我们就可以计算客户相似度。这里最常用的是余弦度量其中客户之间的相似度由其购买向量的归一化标量积给出并且对于相同向量取值 对于不具有任何相同坐标的向量取值 。 余弦度量 皮尔逊相关系数也给出了很好的结果 购买向量之间的相关性越大客户就越相似。 我们应该向选定的客户推荐特定产品的程度的度量是该产品的购买矩阵的 电子邮件数据 加权平均值其中权重是客户之间的相似度。如果许多类似的客户购买了该产品我们将得到接近于 的数字否则结果会更低。 协同过滤系统可以从两个方面进行改进如何计算客户相似度以及如何计算推荐。 客户相似度 一般来说通过加强购买过许多相同产品的顾客的相似性可以取得良好的效果。 假设客户 购买了两种产品 和 。 客户 只购买了产品 。 客户 购买了四种产品 和 。 客户 和 之间的余弦相似度 为 客户端 和 之间的余弦相似度相同 但是客户端 和 似乎稍微多一些除了客户端 和 之外彼此相似。我们应该考虑到这种情况。 与不经常购买的产品相比大量客户频繁购买的产品不太可能在客户之间表现出相似性。因此值得引入与购买给定产品的客户数量成反比的权重。 推荐的计算方式 在某些情况下为产品引入不同的权重是合理的以便特定的产品具有由销售政策产生的偏好。 一个好的解决方案可能是利用您的行业知识并在采购矩阵中的空单元格中输入默认值。您可以使用统计分析来执行此操作例如根据客户所在的行业确定产品购买数量的分布。通过这样的分布您可以填充购买矩阵中的空白区域这应该会对推荐的有效性产生积极的影响。
|
|