几乎所有科技界的人都认为生成式AI、大语言模型和ChatGPT是我们可以用软件来自动化办公的一次世代性变革。关于大语言模型,除了我们仍在探索争议之外,其他方面并没有太多的共识。然而,大家都认同自动化的程度将进一步提高,并且将出现全新类型的自动化,其涉及到就业和人员。
这种变化也发生得非常快:据称,仅仅六个月,ChatGPT已经拥有超过1亿用户,并且来自Productiv的数据显示,它已经成为排名前十二的“影子IT”应用程序。那么,这将带走多少个工作岗位,速度有多快,并且是否可以创造新的就业岗位来替代它们呢?
我们应该记住,我们已经在过去的200年中一直在自动化工作。每当我们经历一次自动化浪潮时,整个工作类别可能会消失,但同时也会创造出新的工作类别。在这个过程中会有摩擦和不适,有时新的工作会流向不同的人和不同的地方,但随着时间的推移,总就业人数并不会减少,而我们也变得更加繁荣。
当这种情况发生在你自己的时代时,担心这一次可能没有新的工作岗位似乎是人之常情。我们可以看到即将消失的工作,但我们无法预测新的工作将是什么样的,而且通常它们尚不存在。从经验上来说,我们知道(或应该知道)过去总是有新的工作岗位出现,而且它们也是无法预测的:1800年的人无法预测到1900年将有百万美国人从事“铁路”工作,1900年的人也无法预测到“视频后期制作”或“软件工程师”作为就业类别。但仅仅因为过去总是发生这种情况,仅仅基于信念就认为这次也会发生似乎是不够的。你如何知道这次会发生?这次会有所不同吗?
此时,大一的经济学学生会告诉我们,这个问题的答案包括“劳动总量”谬论。
“劳动总量”谬论是一种误解,即认为有一定数量的工作需要完成,如果某些工作被机器代替,那么人们的工作机会就会减少。但如果使用机器制作一双鞋变得更便宜,那么鞋子会更便宜,更多的人可以购买鞋子,并且他们有更多的钱可以用于购买其他东西,我们也会发现我们需要或想要的新事物,并创造新的就业岗位。这种有效益不仅仅局限于鞋子:通常,它会在经济中扩散开来,创造新的繁荣和新的工作岗位。因此,我们不知道新的工作将是什么,但我们有一个模型可以解释不仅过去总是出现新的工作岗位,而且为什么这在整个过程中是固有的。所以不要担心AI会代替人类!
我认为,对于这种模型的最根本挑战是说,过去200年的自动化实际上是在提升人类能力的层次。
人类作为劳动力开始逐渐提升:我们自动化了腿部,然后是手臂,接着是手指,现在是大脑。我们从农场劳动转向蓝领工作,再到白领工作,而现在我们也将自动化白领工作,似乎没有什么剩下的了。工厂被呼叫中心取代,但如果我们自动化呼叫中心,还有什么其他工作呢?
在这里,我认为看另一个经济和技术历史的例子很有用:杰文斯悖论。
在19世纪,英国海军使用煤炭作为动力。英国拥有大量煤炭(它是蒸汽时代的石油之国),但人们担心煤炭耗尽后会发生什么。工程师们说:不用担心,因为蒸汽机会变得更加高效,所以我们会用更少的煤炭。但是,杰文斯说:如果我们使蒸汽机更加高效,那么它们的运行成本将更低,我们会使用更多的蒸汽机,并将其用于新的和不同的领域,因此我们将使用更多的煤炭。
我们已经将杰文斯悖论应用于白领工作已经有150年了。
很难想象未来尚不存在的工作岗位,但同样也很难想象已经被自动化取代的过去的一些工作。19世纪30年代,在戈高尔笔下的圣彼得堡,那些备受压迫的职员们整个成年生涯都在手工逐一抄写文件。他们就是人类的复印机。到了19世纪80年代,打字机每分钟可以打出完全清晰的文字,速度是手写的两倍,并且还能免费复制出六份副本。打字机意味着职员的工作产出能够增加超过10倍。几十年后,像伯勒斯(Burroughs)这样的公司的计算器对簿记和会计工作也起到了同样的作用:不再需要用笔计算列数,机器可以在20%的时间内无误完成。
这对文书工作的就业产生了什么影响?人们雇佣了更多的职员。自动化加上杰文斯悖论意味着更多的工作岗位。
如果一个职员配备一台机器可以完成10个人的工作,那么你可能会减少职员人数,但你也可能会让他们承担更多的工作。根据杰文斯的观点,如果某项工作变得更便宜和更高效,你可能会做更多这样的工作——你可能会进行更多的分析或管理更多的库存。你可能会构建一个不同且更高效的业务,这只有因为你可以用打字机和计算器自动化其行政工作才成为可能。
这个过程不断重复。这是1960年电影《桃色公寓》中杰克·莱蒙饰演的CC Baxter,使用了一个来自Friden的电动机械计算器,这已经是计算器出现50年后的事情,当时计算器还是一项新颖令人激动的技术。
新技术通常使得某项工作更便宜、更容易,但这可能意味着你可以用更少的人完成同样的工作,或者用同样的人做更多的工作。它还往往意味着你会改变你的工作方式。起初,我们会让新工具适应旧的工作方式,但随着时间的推移,我们会改变我们的工作方式来适应工具。当CC Baxter的公司购买了一台大型机时,他们开始自动化他们已经存在的工作方式,但随着时间的推移,运营企业的新方式变得可能。
因此,总的来说,我们应该预计大型语言模型(LLMs)会像SAP、Excel、大型机或打字机一样,摧毁、替代、创造、加速和增加就业机会。这只是更多的自动化。机器让一个人可以完成10倍的工作,但你仍然需要这个人。
我认为有两个反对这一观点的论点。
首先,有人可能会说,也许这确实只是与互联网、个人电脑或计算机一样的变革的延续,也许它对净就业没有长期影响,但这一次它将发生得更快,因此摩擦痛苦将更大,适应将更加困难。
LLMs和ChatGPT的发展速度确实比iPhone、互联网甚至个人电脑等事物要快得多。Apple II于1977年发布,IBM PC于1981年发布,Mac于1984年发布,但直到上世纪90年代初期,全球才有了1亿台个人电脑的使用量:而仅仅在六个月内,ChatGPT的用户数量就已达到1亿。你无需等待电信运营商建设宽带网络,或者消费者购买新设备,生成式人工智能只是建立在云计算、分布式计算以及上个十年所建立的大部分机器学习技术堆栈之上。对于用户来说,它只是一个网站而已。
这对工作场所的生成式AI意味着什么?不管你认为会发生什么,都需要数年的时间,而不是几周。
首先,人们在工作中使用的工具以及可能会得到新一层自动化的任务都非常复杂和专业化,并且蕴含了大量的工作和机构知识。很多人正在尝试使用ChatGPT,并看看它能做什么。如果您正在阅读这篇文章,您可能也是这样做的。但这并不意味着ChatGPT已经取代了他们现有的工作流程,替换或自动化这些工具和任务并不是一件简单的事情。
令人惊叹的技术演示与大型复杂公司能够使用的东西之间存在巨大差距。您很少能够直接向律师事务所销售GCP的翻译或情感分析的API密钥:您需要将其封装在控制、安全性、版本管理、客户特权等等诸多法律软件公司才知道的东西中(在过去的十年中,有很多机器学习公司就曾经学到了这一点)。公司通常不能购买”技术”。Everlaw不销售翻译,People.ai不销售情感分析——他们销售工具和产品,而人工智能通常只是其中的一部分。我不认为一个文本提示、一个”开始”按钮和一个黑匣子式的通用文本生成引擎构成一个产品,而产品需要时间。
其次,即使工具构建完成并符合产品市场需求,购买管理复杂的工具也需要时间。在构建企业软件创业公司时,最基本的挑战之一是创业公司运作的18个月融资周期,而很多企业则以18个月的决策周期运作。SaaS本身加快了这一过程,因为您不需要进入企业数据中心的部署计划,但您仍然需要进行采购、集成和培训,而拥有数百万客户和数万或数十万员工的公司没有突然改变事物的充足理由。未来需要一段时间,而硅谷之外的世界则非常复杂。
第二个反对意见是,ChatGPT和LLM的范式转变的一部分是抽象层次的转变:这看起来是一种更通用的技术。确实,这就是为什么它令人兴奋的原因。据说它可以回答任何问题。因此,你可以看一下那张包含473个企业SaaS应用的图表,并说ChatGPT将颠覆这些应用,并将许多垂直应用合并成一个提示框。这意味着它会更快地推进,并且自动化的范围也会更广。
我认为这误解了问题。如果律师事务所的合伙人想要一份论文的初稿,他们希望能以完全不同的方式来定义参数,而与之相比,保险公司的销售人员可能以不同的训练集和肯定会使用一系列不同的工具来质疑索赔。Excel也是”通用目的”的,SQL也是,但有多少不同类型的”数据库”存在呢?这也是我认为LLMs的未来是从提示框转向图形用户界面(GUI)和按钮的原因之一——我认为”提示工程”和”自然语言”是相互矛盾的。但无论如何,即使您可以将所有内容都运行在一个巨大的基础模型上的薄包装器中(对此目前几乎没有一致性或明确性的共识),即使这些包装器也需要时间。
与此同时,尽管有人可能认为LLMs将在一个维度上吸收许多应用程序,但我认为同样有可能它们将在其他维度上带来一波全新的分离,因为创业公司从Word、Salesforce和SAP中剥离出几十种用例,并通过解决人们在LLMs让您能够解决之前都没有意识到的问题来建立更多的大型公司。毕竟,这就是为什么大公司今天已经有了400个SaaS应用的过程。
更重要的是错误率。ChatGPT可以试图回答”任何”问题,但答案可能是错误的。人们称之为幻觉、虚构、说谎或胡扯——这是”自负的大学生”问题。我认为这些都是无益的框架:我认为理解这一点的最佳方法是,当你在提示框中输入内容时,实际上你并没有要求它回答一个问题。相反,你在询问它:”在看起来像这样的问题中,人们可能会产生什么样的答案?”你在要求它匹配一个模式。
因此,如果我让ChatGPT4为我写一篇自传,然后再问一次,它会给出不同的答案。它会建议我曾在剑桥、牛津或伦敦政治经济学院学习;我的第一份工作是在股票研究、咨询或金融新闻行业。这些始终是正确的模式:它是对问题”像Benedict这样的人可能完成什么样的学位和工作?”的100%正确回答。它不是在进行数据库查找:它正在生成一个模式。
您可以从我从MidJourney获得的这张图片中看到类似的情况。Prompt是”在戛纳狮子广告节的沙滩上,广告人员在一个小组讨论创意的舞台上。”
它几乎完美地匹配了模式——看起来像是戛纳的海滩,这些人穿得像广告人员,甚至他们的发型也正确。但它并不知道任何事情,因此它不知道人们从来没有三条腿,只知道这是不太可能的。这不是”说谎”或”编造”——它是在不完美地匹配一个模式。
不管你如何称呼它,如果你不理解这一点,你可能会遇到麻烦,就像这位不幸的律师那样。他不理解,当他要求先例时,实际上他要求的是看起来像先例的东西。他确实得到了看起来像先例的东西,但实际上并不是先例。这不是一个数据库。
如果你理解了这一点,那么你必须问自己,那么LLMs在哪些方面有用呢?在哪些情况下,拥有自动化的大学生或实习生可以重复一个模式,而你可能需要进行检查?上一波机器学习给你带来了可以为你阅读任何内容的无限实习生,但你需要检查,现在我们有了可以为你写任何内容的无限实习生,但你需要检查。那么,在哪些情况下拥有无限实习生是有用的呢?问问丹·布里克林吧——我们又回到了杰文斯悖论。
这显然让我想到了通用人工智能(AGI)。对我刚刚说的一切的真正根本反对意见是问,如果我们有一个系统,它没有错误率,不会产生幻觉,并且确实能做到人类所能做的任何事情,那会发生什么?如果我们拥有这样的系统,你可能不再需要一个会使用Excel的会计师来获得十个会计师的输出:你可能只需要机器。这一次,情况确实会不同。以往的自动化浪潮意味着一个人可以做更多的事情,但现在你不需要人。
然而,如果你不小心的话,这个问题可能变得循环无解。”如果我们有一台机器可以做人类所能做的任何事情,没有任何限制,那么它可以做人类能做的任何事情,没有这些限制吗?”
确实如此,如果是这样,我们可能面临的问题比中产阶级的就业问题更大,但这离现实近吗?你可以花费数周的时间观看长达三个小时的YouTube视频,听计算机科学家就这个问题进行争论,最后只能得出一个结论,他们也不真正知道。你可能还会提出这样一个观点,即这一个神奇的软件将改变一切,并取代真实人员、真实公司和真实经济的所有复杂性,并且现在可以在几周而不是几年内部署,听起来像是经典的技术解决主义,但从乌托邦变成了反乌托邦。
然而,作为一名分析师,我更倾向于休谟的经验主义而不是笛卡尔的理性主义——我只能分析我们所知道的。我们没有AGI,如果没有它,我们只有另一波自动化变革,而且我们似乎没有任何先验的理由认为这一次会比其他所有几次都痛苦。