双语阅读

机器学习如何改变劳动力市场

2019/05/06 12:34
收藏
对照中文英文原文
21世纪将是智能机器的世纪。人工智能(AI)已经开始改变经济,因为它使机器能够完成越来越多的认知任务,而这些任务曾经只有人类才能完成。在未来十年,许多现有的任务将被机器取代,而新的任务将会出现。

Mon May 06 2019 12:06:14 GMT+0800 (中国标准时间)

介绍

21世纪将是智能机器的世纪。人工智能(AI)已经开始改变经济,因为它使机器能够完成越来越多的认知任务,而这些任务曾经只有人类才能完成。在未来十年,许多现有的任务将被机器取代,而新的任务将会出现。几乎每一份工作都会受到某种程度的影响,其中大部分都需要重新设计。企业的兴衰将取决于它们如何理解、培养和驾驭生产力所需的不断变化的技能。如果能够创造和更新创造这些技能所需的机构,经济就会繁荣。

尤其值得一提的是,人工智能的机器学习(ML)分支在过去的十年里取得了显著的进步,这在很大程度上反映了深度学习领域的进步。深度学习是一种在大型数据集上训练大型神经网络的技术(Brynjolfsson和Mitchell 2017)。三种不同类型的进步,每一个约两个数量级,融合在一起,使这一切成为可能:1)增加数字数据的数量和质量,2)计算能力的改善,不仅反映出的摩尔定律,而且新的专业架构gpu和tpu,和3)改进算法(McAfee和布林2017)。因此,ML算法的性能得到了显著提高。在一个被高度引用的例子中,ImageNet数据集上的图像识别算法从2010年的不足70%改进到今天的97%以上,现在在相同数据上的性能已经超过了人类水平。语音识别和自然语言处理、机器翻译、推荐系统、游戏和许多其他任务也得到了显著的改善(Shoham等,2018)。由于视觉、语言和决策等能力对大多数职业来说都是如此重要,这些技术进步表明,工作性质的实质性变化是可以预期的。

然而,尽管有这些令人印象深刻的进步,ML还远远不能完成人类所有的认知任务。这引发了一些显而易见的问题。ML可以很好地完成哪些任务,哪些任务最适合由人类完成?这对就业、行业和不同地区有何影响?我们如何量化人类技能对企业价值的变化?在这篇论文中,我们试图通过利用已经进行了几年的几个研究流来解决这些问题。首先,我们报告的工作是基于对一组机器学习领域领先专家的采访,以制定一套标准,或一个标题,来区分哪些任务最适合机器学习(Brynjolfsson和Mitchell 2017;Brynjolfsson, Mitchell, and Rock 2019)。然后,我们应用这个标题对美国经济中950个职业中的18112个任务进行了评分,从而创建了一个指南,说明随着ML的使用变得越来越普遍,不同的职业、行业和地区可能会受到怎样的影响(Brynjolfsson、Mitchell和Rock 2019)。其次,为了说明不同类型的人力资本(包括技能和教育)如何影响企业价值,我们利用LinkedIn、Compustat和其他来源的数据,利用正在进行的工作,对这些关系进行了新的量化。

我们的第一组发现是,虽然现有的ML技术不能自动化包含我们所研究的任何职业的所有任务,但它们已经足够先进,可以在几乎每个工作中至少完成一些任务。这表明,要充分利用ML的潜力,需要对工作进行实质性的重新设计,并进行大规模的再杀戮。我们的研究结果表明,从事低薪工作的人将受到不成比例的影响,零售业和运输业的人也会受到影响。小城市的人也比大城市的人更容易受到影响。

对工作重新设计的投资可以为公司带来巨大的价值。在第二组研究中,我们利用LinkedIn的数据发现,技能和教育不仅对获得它们的员工有价值,对这些员工所在公司的老板也有价值。事实上,it相关投资的价值已经大幅增加,近年来,基于上市公司的样本,截至2016年底,相当于安装属性的值的39%左右,工厂和设备(约8 - 9美元在国际信托投资公司在样例)。这意味着随着这些技术的日益普及,企业有很大的动力去投资创造和更新利用新兴技术所需要的技能集(最近的一次是ml)。尽管许多技能将受到影响,但实现ML所需的技能是一个值得注意的特殊案例:随着Tensorflow等新技术提高了它们的经济影响,它们的价值显著增长(Rock 2019a)。将ML突破付诸实践所需要的重杀和业务流程重新设计的规模和范围意味着,与早期的技术突破一样,需要数年甚至数十年才能感受到全部效果。(Brynjolfsson, Rock, and Syverson, 2018)。

劳动力市场对机器学习技术的暴露

我们采用任务级方法来理解ML的效果。这是针对特定功能的最自然的分析单元。然后可以汇总有关ML任务级暴露的详细信息,以提高我们对ML对经济的许多方面的影响的理解,包括职业、公司、行业和地区。特别是,职业可以被认为是分配给类似类型工人的有用的任务包。任务级方法将工人的劳动投入与生产功能中的新型技术资本联系起来(Autor, Levy, and Murnane 2003;Acemoglu和Autor 2011)。用资本服务取代人工任务的管理决策的内在特点是在支付给工人的工资和能够完成同样任务的机器的资本租赁成本之间进行权衡。在这类模型中,增加机器能力或降低给定任务的资本成本会增加用资本替代劳动力的动机。

虽然它们在短期内通常是稳定的,但是每个职业中的任务集会随着时间的推移而变化,许多任务本身的性质也是如此。新任务被创建,旧任务的价值发生了变化,改变了给定职业中最有生产力的混合任务可能是什么。相关的一类模型(Acemoglu和Restrepo 2018)阐明了自动化技术投资和创建新任务投资之间的权衡。在这些模型中,自动化程度的提高提高了为人类劳动创造新任务的创新活动的回报。然而,在几乎所有的情况下,新技术对劳动力需求的影响不仅仅取决于简单的人力劳动任务替代潜力。

预测ML对劳动力需求的影响是具有挑战性的,因为任何一种职业通常都要执行各种各样的任务。不可避免地,其中一些任务比其他任务更适合机器学习。然而,关注ML对于当前由工人完成的任务可以做些什么,可以深入了解哪些任务最容易受到技术的影响。Brynjolfsson和Mitchell(2017)、Brynjolfsson、Mitchell和Rock(2018、2019)和(Brynjolfsson等人2019)构建、细化和扩展了一个规则,该规则旨在识别经济中最适合机器学习(SML)的任务。题目由23个评估问题组成,潜在答案从1(非常低的SML)到5(非常高的SML)不等。该标题用于从美国政府的O*NET数据库中为2059项详细工作活动创建评分。然后,这些分数被汇总为950个职业,包括18,112个任务,这些任务在不同职业之间共享详细的工作活动。在经过机器学习专家的验证,并由麻省理工学院的一个团队对一组具有代表性的任务进行评估后,rubric评估被CrowdFlower上的受访者扩大到全套任务,如Brynjolfsson、Mitchell和Rock(2018)所述。Brynjolfsson、Mitchell和Rock(2019)以及Brynjolfsson等人(2019)的后续迭代使用了来自Amazon Mechanical Turk受访者的数据,并进行了一些进一步的改进和质量控制。这些问题的设计是这样的,“1”(强烈不同意)对应低SML,“5”(强烈同意)对应高SML,中性暴露对应3分(既不同意也不不同意)。在大多数分析中,这些个体得分的值基本上都取平均值,以得到总体任务加权职业级别SML得分

暴露于ML并不一定意味着人类的劳动将被取代,甚至在该职业中减少。Brynjolfsson和米切尔(2017)中讨论,除了替换,毫升也可以使用在其他至少五个方面:补充劳动力,增加对降低成本的需求,需求变化通过改变整体收入,改变信息流动和信息不对称,或驱动重组工作。虽然有很多强调第一种可能性(自动化和替换)的研究表明,影响最大的在未来几年将在推动设计的工作,因为只有一些任务在大多数职业适合机器学习,而另一些人则将继续要求人类劳动。

根据SML评分,职业对机器学习的接触程度差别很大。下面的图1显示了SML在作业、任务和活动之间的分布。很少(如果有的话)职业完全暴露于ML中。任何任务的最大SML值为4.0,所有任务的最小值为2.13。引人注目的是,几乎所有职业都至少有一项SML得分相对较高的任务。图2显示了在SML的第90和第50百分位(水平轴)之上的职业数(垂直轴)与任务SML所占比例的关系。没有一个职业的任务完全在SML百分位数的第90位(或更高),但是大多数职业至少有一些任务超过这个阈值,几乎所有的职业都有一些任务超过50%的阈值。

如果ML可以完成某个特定职业的所有任务,那么就不需要或没有机会重新组织该工作中的任务。它将完全自动化。同样地,如果ML在该职业中无能为力,就没有理由重新组织该职业来解锁ML技术的收益。大多数职业都处于这两个极端之间,这一事实突显了机器学习将推动任务如何捆绑和分配到职业中的重组和重新设计的可能性。事实上,Brynjolfsson等人(2019)强调,对于ML来说,最具经济潜力的劳动力需求力量是工作的重新组织,而不是自动化或替代(见图1和图2)。2、3

ML的职业影响将在许多不同类型的劳动力中共享,但也将是不平衡的。一些职业,以及行业和地区,比其他职业更容易受到ML的影响。图3显示,工资较低的职业具有相对较高的SML得分,尽管所有工资水平都有一些职业位于SML谱的两端。图4A和图4B分别显示了按职业类型聚合到区域级别的标准化SML评分和图像数据评分(分别)。大城市的SML得分相对较低。相比之下,使用ML进行图像分析的潜力大多集中在大城市。最后,图5显示了按行业划分的就业加权SML。住宿和食品服务、运输和仓储以及零售贸易相对来说比教育和医疗更容易受到ML重组的影响(见图3-5)。5、6、7

较高的SML任务通常是文书工作,如平衡帐目或医疗记录,或在工厂可能完成的常规工作类型(例如检查缺陷项)。大多数职业都有一些文书工作的组成部分。但是,利用这项新技术将需要调整这些任务一起执行的方式。这意味着改变职业,也意味着改变业务流程。

企业和组织必须建立新的无形资本,以补充机器学习进步所创造的新型技术资本。与此同时,为旧经济环境构建的专有技术和隐性知识将失去价值(Greenwood和Yorukoglu 1997)。通过这种方式,ML技术的未来变化类似于许多早期的信息技术。现在正在发生的事情,部分是对过去的延伸,其特征是对网络计算、数据库和其他信息技术的投资浪潮。

IT、无形资本和价值

业务流程再造需要从新兴技术(如ML技术)中释放价值,它可以包含公司资产的一个不断增长的类别(R. E. Hall 2001;Brynjolfsson和Hitt 2000;Bresnahan, Brynjolfsson, and Hitt 2002)。这种“与it相关的无形资本”(“ITIC”)是企业投资成为信息处理组织的结果,包括在业务流程再造方面的投资,这些投资有助于快速获取信息、员工学习和决策。这些类型的资产可能在解释经济增长和企业业绩等经济结果方面发挥着越来越重要的作用。在某些方面,这些投资类似于公司以卡车或制造设备等实物资本进行的投资。正如有形资本的单位能够使原材料转化为商品一样,国际信托投资公司的单位能够使信息和想法转化为产品和服务。

最大的不同在于,事实证明,衡量这些基于it的无形资产是难以捉摸的。对这种资本形式的投资(对研究人员来说)基本上是看不见的,折旧率是特殊的和可变的,因此衡量资本存量的传统方法不容易应用(B. H. Hall 1993)。对于其他类型的资产,人们可以使用市场交易,如租赁或转售价格,来推导价格,但没有独立的iif交易的可见市场——公司不能出售他们的管理实践或学习文化。

作为衡量这些资产的另一种方法,我们可以使用有关无形资产的文献中的方法来得出美国公司ITIC的价格和数量的变化。本文认为,公司的无形资产的数量可以从其证券的价值推断(R. E. Hall 2001)。这种方法背后的直觉是,在合理的条件下,一个公司的证券的价值相当于其资本资产的价值,这反过来等于资本乘以它的安装数量的价格,或者说,安装了资本市场价值的比例等于其价格(方程1)。

由于企业对这些资产的投资受调整成本条件(式2)控制,由t时刻投资率下的边际调整成本函数8得出:

因此,我们有两个方程与两个未知数,可以解决回收数量的有形或无形资本。换句话说,即使资本投资不能被直接观察到,它的数量也可以通过公司资产价值的变化来计算。在IT的情况下,公司的ITIC值不被记录,但是这些ITIC值可以通过对相关输入的代理投资度量来推断,比如IT基础设施(Brynjolfsson、Hitt和Yang 2002)。我们使用上面描述的方法来推导ITIC的量。

这种方法的一个挑战是,需要长时间的公司级别的IT投资数据,而从历史上看,在公司级别很难获得此类数据。为了解决这个问题,我们生成了一个IT系列,它是构建iit实验室中最重要的输入之一,以支持上述方法的应用。

这些数据来自领英(LinkedIn),这是一家领先的在线专业网络网站,个人可以在上面发布自己的工作经历,包括他们曾经从事的每一份工作的雇主、职位和在该公司工作的年限等信息。雇主数据通常包括姓名、规模和行业。我们使用LinkedIn上自称为IT工作者的员工的就业历史来衡量大型上市公司在近30年时间内IT就业的分布情况

这个分娩系列的长度很重要,有两个原因。首先,它总是可以通过互联网泡沫破灭,崩溃后,通过过去十年包括获取大数据周围的支出上升,数据科学,和机器学习,所以我们可以测试多少it相关无形资产的价值在1990年代末可归因于投资者错误定价或当该资产支出恢复。其次,在缺乏对IT相关基础设施支出的直接措施的情况下,支付给IT工人的工资是ITIC建设的主要投入之一。换句话说,企业可以围绕旧的IT资本构建新的信息结构,因此IT工资对ITIC投资的影响可能比IT资本支出更大。

将这些IT劳动数据应用于前面描述的模型的关键结果如下面的图6和图7所示。首先,到2016年,it相关无形资本的股票在我们小组firms10已经增长到了大约25%的实物资本存量的价值(图7)。尽管国际信托投资公司的价值波动在互联网繁荣与萧条,公司继续积累it相关无形资产泡沫破裂后,通过2008年的经济衰退(参见图6)。

我们还发现,这些IT无形资产在美国经济中的分布存在显著的异质性。图8以ITIC股票价值为单位,用五分位数表示ITIC的数量。这一数字表明,这种资本形式的增长远远没有开始均匀分布,而是集中在相对较小的一组公司中,这与最近的经济数据中观察到的其他数字化和公司主导的模式是一致的。为这些公司提供更多的ITIC意味着它们将在未来享有显著的基于生产的优势(参见图7)。

用于实现机器学习的技能的市场价值

我们评估ITIC的方法如何说明可以用于实现机器学习的技能?公司构建的无形资产类型会随着时间的推移而变化,以适应IT环境。技术的变化也会改变已安装资本基础的价值,包括人力资本的价值。使用LinkedIn技能数据,Rock (2019a)发现谷歌的开源发布TensorFlow将使用ai的上市公司的市值提升了4 - 7%。TensorFlow是一个软件包,它使软件工程师和数据科学家更容易实现深度学习模型。与用Python或c++编写代码比用汇编语言编写代码更容易相似,TensorFlow节省了构建和训练神经网络所需的大量工作。正因为如此,当TensorFlow成立时,拥有与人工智能相关无形资本的公司价值增加了。这些公司从无形资产中创造价值所需要的补充劳动力变得更加丰富。虽然这对相关公司产生了影响,但这只是it相关无形资产整体上涨的一个相对较小的例子。要实现人工智能技能投资的回报,往往需要在云计算、数据工程和专业管理等其他IT技能方面进行大量投资。所有这些技能类型都需要对it相关无形资产进行互补投资(Tambe 2014)。

ITIC增长的含义

我们的研究结果表明,对信息结构和相关技能的投资可以产生相对长寿、耐用的资产。对于政策制定者来说,这些发现表明,对it相关无形资产的大量投资与重要生产能力的发展有关,而且在其他条件相同的情况下,这应该会提振长期增长的前景。近年来,ITIC资产的表现与其它资本资产类似,这本身就很有趣。这可能是因为将组织创新转化为生产性资本需要在再造和技能方面进行大量投资。

然而,ITIC与实物资本之间存在着重要的区别。与大多数实物资本不同,ITIC在企业外部的价值已经下降。这对公司估值和收购具有重要意义。发展研究人员传统上将资本积累视为增长的引擎。由于缺乏与it相关的无形资产的二级市场,这些问题以一种重要的方式联系在一起,关系到企业的健康。当公司被解散时,ITIC很可能会消失。因此,有必要继续加深我们对ITIC重要性的日益上升以及ITIC与实物资产之间的显著差异如何影响经济行为的理解。

结论

自工业革命以来,蒸汽机和电力等通用技术推动了经济增长和更高的生活水平。我们认为,我们这个时代最重要的通用技术是人工智能,尤其是ML。通用技术的一个关键特征是,它们能够实现互补的创新和投资。最重要的补充是新技能和新业务流程。与工厂和设备不同,技能和工艺创新是无形的。这使其难以衡量,并使其受到投资不足和投资不当的影响。通过使用SML框架,我们可以确定一些最有可能受到机器学习影响的任务,以及它们的一些相关技能。

总体而言,it相关无形资本的大幅增长,加上实现ML所需技能价值的飙升,表明企业在重新裁减劳动力方面发挥了重要作用。我们的分析表明,当公司员工拥有更多合适的技能时,股东将从中受益。然而,尽管技术的进步往往令人惊叹,但劳动力的重新裁减和业务流程的重新发明却一直滞后。例如,根据Decker等人(2016)的研究,这反映在业务活力的下降上。解锁价值的关键瓶颈往往不是技术,而是人。因此,为了适应ML支持的工作,21世纪的重大挑战将是加快采用支持这些技术的新技能和组织实践。

埃里克·布林约尔松(Erik Brynjolfsson)是麻省理工学院数字经济计划(MIT 's Initiative on the Digital Economy)主任,麻省理工学院斯隆商学院(MIT Sloan School of management)管理学教授。Daniel Rock是麻省理工斯隆管理学院的博士生,Prasanna Tambe是宾夕法尼亚大学沃顿商学院的运营、信息和决策副教授。

支持数据

图1所示。职业、任务和详细工作活动的机器学习适宜性(SML)评分的分布

图2。职业的直方图按任务的比例SML大于第90和第50百分位阈值

图1和图2的来源:Brynjolfsson、Mitchell和Rock (2018a);岩石(2019)

图3。SML得分与2016年工资中位数百分比;回归系数:-0.0034 (t-stat = 18.5)

图4。按地区划分的标准化SML评分

图3的来源:Brynjolfsson、Mitchell和Rock (2018a);岩石(2019)

图4 b。按区域标准化图像数据评分

图5。就业加权平均SML由2位数NAICS行业

图3-5的来源:Brynjolfsson、Mitchell和Rock (2018a);岩石(2019)

图6。1987年至2016年上市公司ITIC和PPE数量的变化

图7。依四分位数划分的ITIC的数量

为提升阅读体验,智堡对本页面进行了排版优化 查看原文
评论