量中使用的数据类型 | Australian Gunpla Builders Support Network

量中使用的数据类型 Dec 24, 2023 3:51:39 GMT

Quote

Post by raselbd296 on Dec 24, 2023 3:51:39 GMT

您还可以使用购买的产品总数或购买花费的总平均金额而不是二进制表示法。购物向的选择将影响推荐系统的有效性并且应该在比较不同的变体之后做出。有了购物向量我们就可以计算客户相似度。这里最常用的是余弦度量其中客户之间的相似度由其购买向量的归一化标量积给出并且对于相同向量取值对于不具有任何相同坐标的向量取值。余弦度量皮尔逊相关系数也给出了很好的结果购买向量之间的相关性越大客户就越相似。

我们应该向选定的客户推荐特定产品的程度的度量是该产品的购买矩阵的电子邮件数据加权平均值其中权重是客户之间的相似度。如果许多类似的客户购买了该产品我们将得到接近于的数字否则结果会更低。协同过滤系统可以从两个方面进行改进如何计算客户相似度以及如何计算推荐。客户相似度一般来说通过加强购买过许多相同产品的顾客的相似性可以取得良好的效果。假设客户购买了两种产品和。客户只购买了产品。客户购买了四种产品和。客户和之间的余弦相似度为客户端和之间的余弦相似度相同但是客户端和似乎稍微多一些除了客户端和之外彼此相似。我们应该考虑到这种情况。

与不经常购买的产品相比大量客户频繁购买的产品不太可能在客户之间表现出相似性。因此值得引入与购买给定产品的客户数量成反比的权重。推荐的计算方式在某些情况下为产品引入不同的权重是合理的以便特定的产品具有由销售政策产生的偏好。一个好的解决方案可能是利用您的行业知识并在采购矩阵中的空单元格中输入默认值。您可以使用统计分析来执行此操作例如根据客户所在的行业确定产品购买数量的分布。通过这样的分布您可以填充购买矩阵中的空白区域这应该会对推荐的有效性产生积极的影响。