卢卡斯的批判和理论的必要性

二〇一九年十月一十六日

塞缪尔。布朗

命名的卢卡斯批判经济学家罗伯特·卢卡斯是一个理论结果,炸毁了宏观经济学的学科在1970年代,及其影响是直接相关的工作,数据科学家所做的国家工作,我做在Wayfair算法团队!就像连体衣和农家服装一样,旧的又会变成新的!所以,想象一下你自己身处某种令人难以置信的70年代时尚之中,和我一起踏上一段书呆子之旅吧。首先,我会阐明卢卡斯的批评并解释它的含义;然后我将把它应用到一个简单的例子中;接下来,我将在Wayfair上解释它与数据科学的关系,并将其应用到另一个来自我自己工作的例子中;最后,我想说的是,即使对我们这些数据科学家来说,数据本身也是不够的——我们需要理论来正确地完成我们的工作。

好了,我们走吧!

卢卡斯批判的核心

尽管自20世纪70年代以来,人们已经花费了大量笔墨,对卢卡斯的批评进行了复杂的数学处理,但其核心主张在简洁中显得优雅:

从模型只包括人们对政策变量的变化响应导出策略规则,而不是在政策规则的变化,一般将无法达到最佳。

现在让我们来解开这一核心要求在五个关键术语:模型,方针,政策变量,政策规则和最优的。

  1. 一个模型是机构和人们如何做决定的数学表示。
  2. 一个政策是影响决策(如政府债券投资或购买沙发)大量的人的任何动作(如设置利率或沙发的价格)由一个机构(如中央银行或Wayfair)拍摄。
  3. 一个政策变量任何数量(如利率或价格),是有关这些决定。
  4. 一个策略规则是决定什么样的政策取,考虑到政策变量的值的任何程序。
  5. 策略规则最佳如果它产生的任何数量的机构关心的最大可能值(如GDP或利润)。

现在我们明白了卢卡斯批判的核心,让我们将它应用到一个简单的(如果有点荒诞)的例子。

应用卢卡斯批判:一个案例研究

假设波士顿市非常关心违章停车后湾区附近(其中Wayfair总部所在地)。正因为如此,波士顿市实现了一个新的,严厉的停车政策规则:每一天,一个在30岁的机会,它会选择非法停在后湾一辆汽车,并在查尔斯河倾倒。根据这项新政策,每月一个不吉利汽车平均将在河的(尽管因为政策的概率结构,几个月会看到没有汽车满足这个水样的命运底端起来,别人会看得到超过一)。假设,很短的时间量之后,这决然极端策略规则是否足以遏止从停车人在后湾非法的任何地方。

在政策规则和行为产生变化的这种变化如下图所示。第一个节目在之前和之后的新的停车政策的实施发现车倾倒在查尔斯,日常开支。第二个演示如何,这项新政策实施后,人们了解他们有他们的汽车通过观察这种事发生在自己倒霉的同胞毁坏的几率就越大。第三个节目的人本如何应对增加较少(最终零)的停车违规从事感知车辆破坏的可能性。

图1:波士顿市更改停车政策规则前后的行为。

现在,假设一段时间的推移和波士顿市要重新评估它的后湾停车政策,所以它要求你和我创造的货币量之间的关系的模型,可以花费执行每月与此策略规则违规停车每月的数量。我们从过去一年在培训这两个变量我们用模型数据。由于没有人在此期间违停,我们的模型告诉我们,有花在执法和违章停车的数量的钱没有任何关系。这是因为,根据现行政策规定,后者则是无论前者的价值为零。换句话说,在此期间将随机选择一个水样的处理的一个或多个汽车是几个月,没有违规停车发生;并且在没有这样的选择是发生在几个月,仍然没有违章停车的发生。这似乎缺乏的关系是在前述图表示的训练期间容易明显的。

在这个简单的例子,我们的模型暗示的最优策略规则是花零元执行这一严厉的停车政策,因此中止它完全。为什么要浪费金钱搜索后湾汽车有资格在查尔斯倾倒如果没有这样的汽车存在吗?对?

错误!由于城市的预算是公共记录的问题,人们最终会发现,波士顿市不再花费任何金钱上执行其严厉的Back Bay停车政策。最终,这些信息将成为众矢之的,而违规停车将再次激增。您可以在下面的图表,显示了相同的结果前面的地块看到这一点,但也包括会发生什么(在这个假设的情况),波士顿市中断其新的停车政策之后。需要注意的是违章停车无情地爬行备份它这样做了。

图2:波士顿市的后长期行为中止其新的停车政策规则。

那么,为什么我们去错了吗?我们没有给卢卡斯批判适用于我们的模型!We only modeled people’s responses to changes in our policy variable (the amount of money spent per month on enforcement) and did not model their responses to changes in our policy rule (every day, with a chance of one in thirty, select one car that is parked illegally in Back Bay and dump it in the Charles River). Because of this crucial omission, we failed to recognize that people only behaved the same regardless of monthly enforcement spending levels because they were responding to the current policy rule, and that they would respond very differently to those same spending levels under a different policy rule (like always spending zero dollars per month on enforcement).

这个简单的例子说明了卢卡斯批评背后的动机:由于人们会在不同的政策规则下对相同的政策变量值做出不同的反应,如果我们打算使用这些模型来推导出最优的政策规则,我们需要将后者包括在我们的模型中。

卢卡斯在Wayfair上的评论

那么这和Wayfair的数据科学有什么关系呢?一个更好的问题可能是它是如何做到的!在Wayfair,我们在数据科学方面所做的几乎每一件事都涉及到开发人们的行为模型,并利用它们推导出最佳的政策规则。决定Wayfair.com上的价格是一个政策规则。策略规则是决定在什么时间对什么产品进行销售和促销。决定在web页面上显示产品的顺序是一个策略规则。我可以一直说下去,但我想你明白了!卢卡斯的批评基本上适用于我们在Wayfair做的所有数据科学工作。所以,如果我们想做正确的事情,我们需要注意它!

在Wayfair.com售旗

好了,现在我们已经理解了Lucas的批评以及它是如何与Wayfair的数据科学相关联的,让我们来看一个更相关(和现实)的例子,这个例子来自我在Wayfair所做的工作:sale flags。销售标志是一个写着“sale”的小红方块,并出现在Wayfair.com上产品图像的左上角(示例请参见图3)。

图3:在Wayfair.com销售标志的产品形象。

这个看似简单的信号背后隐藏着复杂的行为含义。我花了很多时间思考和分析这些含义,因为我的团队开发了一种算法来决定在Wayfair.com上分配哪些产品和多少产品的销售标志。请允许我详细说明。

假设Wayfair更容易分配销售标志,以产品更大的折扣(这是真实的,顺便说一句)。此外,假设人们不完美回忆过去的价格,部分推断从接收一个产品的数量由销售标志隐含的折扣幅度。在这种情况下,对于一个给定的价格,人们会正确地推断销售标志的数值越大表明更小的隐含折现。

当价格是固定的,那么这种推论是相对简单的。当价格的方式,是无法预测的波动,那么推论变得更加复杂。在后一种情况下,一个人不能立刻推断,其在某一天卖旗的一个更大的数量由优惠价格的较大数量,或是由于Wayfair只是选择地出售标志上更多的产品的程度。正因为如此,人们必须遵守的价格和在多天里销售的标志,甚至数月的变化,以此来推断多大的折扣被出售标志暗示。

可以说,我们生活的世界是更喜欢后者,更复杂的情况下,在与人互动Wayfair.com随着时间的推移,慢慢地学会如何大的折扣是由我们的销售标志暗示。当他们了解这一点,他们就会到销售的标志不同的反应。据推测,较大的,他们从销售标志推断的折扣,他们越有可能将在其与销售标志来购买产品,并成反比。(对于你书呆子经济学家在那里,我们可以把这个作为对未来价格的不确定性完全理性的反应。)

如果这一切都是真的,那么我们有一个重要的长远的权衡做出选择很多打折的产品应该如何获得销售标志时。每增加销售标志的概率增大,有人购买接收它的产品,这往往增加Wayfair.com上的订单总数。然而,每一个附加的销售标志也会降低每一个销售标志所隐含的折扣的幅度,因此也就降低了销售标志增加购买可能性的程度减少总的订单。

将卢卡斯的评论应用于销售标志算法

现在让我们用卢卡斯批判的语言来重新阐述第二个例子。在这种情况下,我们的政策规则是打折产品的一部分,我们指定一个出售国旗,我们的政策变量的数量产品出售国旗在给定的一天,和我们感兴趣的响应可能是人们购买一种产品出售国旗。人们通过观察价格和政策变量随时间变化的值来推断我们的政策规则。最优策略是在Wayfair.com上增加最多订单的策略。在这个最优策略下,由于我们分配了销售标志的折扣产品的比例增加而导致的订单的长期增加正好被随之而来的人们购买带有销售标志的产品的可能性的减少所抵消。

现在假设我们创造的产品,在某一天出售的标志和一个人会购买一个产品和销售标志的概率数量之间关系的模型,但是我们不会在我们的模型策略规则多么的不同包括:可能会影响这种关系。如果我们培养这种模式与我们目前的策略规则下收集的数据(比如,指定销售标志打折的产品的75%),那么它会告诉我们,有一个卖旗在给定的产品数量之间没有关系一天,一个人会购买一个产品和销售标志的概率。这是因为,如上所述,人们推断折扣从我们的政策所暗示的销售标志规则(这一直保持不变),而不是从我们的政策变量(这可能每天都在变化)。所以在我们的数据集中,人们的行为并没有随着政策变量的变化而变化,我们错误地认为两者之间没有关系,而实际上两者是1。

如果我们从这个模型得出的最优政策,这将是一个销售标志分配给每一个折扣商品。这是因为模型告诉我们,这样做会对哪个销售标志增加购买概率的程度没有负面影响。但正如我上面所解释的,这种负面效应实际上确实存在,那么最优策略是几乎可以肯定是一个受让人销售标志,以打折的产品的一些小部分。

这已经很糟糕了。但更糟糕的是!假设我们实施了从我们的模型中得出的不正确的“最优”政策。随着时间的推移,人们通过与Wayfair.com的互动,慢慢了解到我们的销售标志所隐含的折扣有多大,所以他们需要很长一段时间才能了解到这个隐含折扣现在比以前要小,并相应地调整他们的行为。因此,如果我们用执行新政策后不久的数据重新训练我们的模型,人们还没有时间进行调整,我们的模型将给我们相同的错误结果!在最坏的情况下,我们的新政策可能会降低长期利润,尽管我们的模型告诉我们的恰恰相反!

理论的必要性

所有这一切都使我想到我最后也是最重要的要求:我们需要理论;数据本身是不够的!正如我们上面看到的,人们对政策变量的反应是由他们的策略规则的看法介导的。后者是一个抽象的,不能在数据,这意味着我们需要有人类行为的理论,以包含在我们的模型中直接观察到。此外,我们需要以预测人们将如何在我们还没有收集科学数据的任何数据,一个很常见的需求新的策略规则反应理论。要正确地把它简洁,以模型的人的行为,我们需要了解为什么人们做他们做什么,而不是简单地观察什么他们做的事。这就是卢卡斯批判的力量所在。

致谢

非常感谢克里斯汀娜塔吉克的定制头部插图!

提交评论

注意:您的电子邮件地址才能添加注释,但将不会被发表。