TopShelf:如何安排产品的页面,而不是仅仅对他们进行排名的列表

2020年5月5日

丹尼尔·桑德斯

上级的产品或搜索结果列表中的许多方法是基于分配分数的每个项目和按降序排列,换句话说排序,排序的贪婪方法。在电子商务中,预测模型将产品,客户是最有可能在顶部有兴趣,其次是第二个最有可能的产品,等等。但在实体店店主知道货架的安排是关键,而产品的吸引力是不是一个固定的质量:它可以根据上下文中,一个产品出现真正改变。例如,将一个更便宜的项目旁边的同一类别的一件昂贵的物品就可以向他们都关闭自己的最佳优势,突出一个的节俭和其他的奢华。当货架上都完美安排,即使有个别产品卖的少,店里作为一个整体将会使更多的销售。这种现象进行了研究营销心理学的标题下语境效应包括等现象的吸引力,折衷,而且相似的效果。

在Wayfair,我们在给定时间使用该预测ATC的概率(加入购物车),一个国家的最先进的深度学习模型对每个产品的客户。页面中的项目的ATC概率用于实时该页面进行排序。这种做法对我们来说非常成功,但它假定该产品的本地环境没有关系。然而,网站上的产品几乎都在列表中显示与邻居,要么上方和下方,或周围的一切产品中的网格。通过优化布局网页作为一个整体的我们可以共同提高客户体验和网站性能更进一步。我们可以训练一个模型,它是一个产品的邻国,包括价格,销售标志饱和度和视觉多样性的性质敏感,没有关于影响的方向做任何假设。例如,多样化的选择可以帮助销售艺术墙(其中品种将使其更容易扫描看起来各式各样的),而在厨房用具的类别的人可能更喜欢比较同类项(其中相似性将使其更容易的找到菜刀的确切合适的款式,例如)。

要做到这一点,我们开发了一种新的模式,称为TopShelf-充当的扩展,这种现有的产品排名算法,并利用产品的并置,使列表或网格作为一个整体光泽。它认为浏览页面为一系列的“货架”,并采用了前几名货架之间的预测模型来重新整理项目最大的吸引力在页面上。本文的其余部分解释它是如何发展的。

第一个挑战:定义上下文

为了训练安排浏览网页是当地的上下文敏感的模型,我们首先来定义这方面将如何代表,包括它是如何达到为止。比方说,我们定义了一个沙发上Wayfair的上下文沙发浏览网页在它周围的所有其他沙发的摆放的位置上。鉴于16000个沙发在我们的目录中,可能的上下文的数量很快就会变得不可收拾!即使我们限制的背景下可能出现一个浏览页面上的48个产品,仍然会留下1.24×1061可能的安排,超过原子组成地球的号码!

虽然寻找一种方式来驯服的可能性,以评估组合爆炸,我们注意到,大多数显示器只显示产品一行在同一时间。因此,我们的假设是,在这种情况下,最相关的本地环境是出现在同一行或“架子” -of产品格的产品,并在货架上的确切顺序是尽管其他更广泛的那么重要上下文的定义-reaching也是可能的,有效的推荐的产品意味着我们选择了上下文的狭义的定义,可能还是捕捉重要邻国的重要作用列出的需要。

评分上下文中的产品

定义这个上下文后,第一步,我们迈出优化的网页作为一个整体是建立一个新的排名模型得分的产品,而不仅仅是一个客户在他们的浏览旅途的某一点,同时也为所有的可能的上下文该产品可能会出现。当然,训练数据没有包含每一个产品每一个可能的方面,但也有在Wayfair的产品网格足够的变化,我们仍然能够概括一个邻居的属性的影响。

我们这个模型构建的训练数据集不仅包含产品和客户属性,但也从同一货架上发现的另外两款产品衍生的新功能列。这些功能包括邻居的价格,他们的销售情况(他们有没有在角落里一个“买卖”标志),他们的产品图片多远是从目标产品的图像视觉嵌入空间。使用这个数据集,我们就培养了深层神经网络,就像我们对于我们普通的个性化排序算法做。

在所得到的模型中,得分-其表示在其一个点的产品的一个客户值旅程-取决于邻居(参见图1的例子)。有些产品是上下文很敏感,而有些则不是。在这个例子中,比分为目标床(左)在的情况下高得多,当邻居们都比较昂贵,在视觉上更加遥远,并且有较少的销售标志。

图1:模型可能得分相同的产品更高或者根据附近的产品相同的虚拟货架上降低。在这种情况下,当邻居们都更便宜,更相似,并在销售,模型分数左边比他们更便宜,更不同,不是所有的销售更高的床。

实际上,在这个例子中有邻和S的视觉距离之间的稳定的线性关系核心由模型分配,以及邻居的价格和分数之间。参见图2这种关系的图解。

图2:通过上下文reranker性质的产品的分数将取决于上下文。这些图表示出两个相邻的可视距离(其捕获视觉多样性)和邻居的价格和对一个特定床模型得分之间的正相关性。

虽然这是很难概括的上下文特征的影响,因为效果可以通过其他特性来调节,我们经常会看到更高的价格和多样化翻译的这种现象,以更高的预测ATC率。但神经网络能够捕获所有的高阶相互作用和类别的特定现象能够改变的语境效果。添加提供了在两个MSE和AUC模型试验性能有显着增加,这些上下文特征。

TopShelf:使用内容Reranker页面优化

有一个情境排序模式使我们能够预测有多好每一个产品将在一个特定的地方背景做。但是,我们仍然需要翻译成建设一个更优化的页面布置。与此相反,以基本的排名算法试图优化的页面作为一个整体时,不考虑背景下,将产品不再是简单降序得分顺序排序。这是必要的,以评估产品在众多可能的上下文,而当它们被放置他们又将提供上下文等产品。虽然假设上市较早的帮助,以减少的可能性,每一个潜在的货架需要三个神经网络的评价,或约50,000为每一个浏览页面加载,这可能会增加不可接受的滞后。通过专注于优化顶部的每一页上的15款产品,(前5个货架的3个产品),我们能够削减我们的搜索空间下降到455架,或1365分的评价,以及或者这个号码可以按比例上下取决于性能需要。

Wayfair的新算法TopShelf使用使用当地的情况来安排产品在页面顶部的最关键位置的客户行为这一模式。TopShelf类似于一个基本的排名算法,因为它贪婪地挑选具有最好成绩的项目,然后选择最佳的还剩下什么,直到没有选项依然存在。但不是一流的产品,TopShelf排名可能货架。如图3所示,被选择的架子时,包含这些产品的所有其它搁架排除在考虑用于下一轮的得分。

图3:TopShelf的步骤,利用内容排名模型来贪婪地选择得分最高的货架,并安排前15名的产品。

一个挑战,我们在开发的算法确定如何在上下文中的每个产品的评分score架子作为一个整体面临。第一种方法是采取平均每个货架上的分数。然而,离线评估(见下文)显示,以销售为页面最大化作为一个整体,它可能是更好的挑选最好的货架最大值的成绩。子件(此概念在图4中示出)。

图4:给予产品在排名前15位,当我们的标准深度学习算法或在TopShelf不同配置的产品排名的分数。该TopShelf算法建立是推动最左边的项目的得分在货架上,有时在货架上的其他项目的预测上诉的费用货架。

页宽性能提升离线评估

该建议在团队使用Wayfair严格离线评估之前,任何试射新车型比较以前的基准线,根据历史数据计算指标,如NDCG和召回。然而,这些指标奖励算法只用于放置这实际上是由客户选择为高的排名越好,而忽略对客户行为的附近的产品的效果的项目。度量捕捉这些影响和奖励助推页面的整体ATC率应该更好地满足我们最关心的,整体的ATC率的产品页面的关键绩效指标的在实践表现。

因此,我们训练的模型来预测从单个产品的情境排序器的分数,位置效应,以及产品品类的组合页宽ATC率,因为位置在页面上更高类别之间大大受到更多的关注和ATC率不同。在我们所研究的高流量类别,TopShelf升压相对于基本排序算法(参见图5用于通过类可视化)页宽ATC率约5%的基线多种以上。

图5:在项目的页面由基本深度学习模型重新分级,网页作为一个整体的估计ATC率提高。然而,当他们进一步TopShelf重新排列,这种估算增压进一步的取样,所有六个顶班增加。

在这个发展阶段,我们还努力优化生产运行,因为任何时间算法采用上运行的需要对现有的推荐系统的时间顶部加入。

我们从来没有被完成

TopShelf是一种方法的切割边缘场石板优化,并有一些新兴的技术,我们希望作为替代在未来方法来评估。TopShelf充分利用我们现有的推荐引擎,在浏览网页的顶部有效地优化最赚钱的插槽,它会考虑提供上下文的利益的一个关键第一次测试。这是该公司在推荐策略的新方向显著,从时间到页面的整体优化一个产品。一旦这一概念已被证明为浏览网页,它可以被应用到每一个网站的一部分显示在产品方面:销售网页,电子邮件,“客户也查看了”旋转木马,等等。和邻近的产品的许多其他功能,可以添加。随着深层神经网络功能中捕获相互作用的力量,我们可以在任何情况下都是影响资本,不只是那些发现并在营销心理学效应是强大的或微妙的,个性化的或通用的,积极或消极,直接或命名互动与其他效果。背景的重要性!

提交评论

注意:您的电子邮件地址才能添加注释,但将不会被发表。