2023生成式AI:为什么今年标志着重大转折
2023生成式AI:为什么今年标志着重大转折

2023生成式AI:为什么今年标志着重大转折

生成式AI的承诺与进展

在ChatGPT推出一年后,生成式AI正获得主流认可。大型语言模型(LLMs)如GPT-4正被广泛应用于各种实际应用,从聊天机器人到计算机编程再到医学和法律。采用速度令人瞩目——在GPT-4发布后不久,利用其能力的聊天机器人已公开可用。由于LLMs的通用性,生成式AI的应用非常迅速。未来将带来更强大的前沿模型。但即使在现在,证据表明这些技术已经产生了深远的影响。

由于其少样本学习和零样本学习的能力,LLMs正在各个领域得到广泛应用。应用领域涵盖了聊天机器人、计算机编程、医学、法律、机器人技术等,2022年已有100多篇论文详细介绍了新颖的用途。在某些专业任务中,LLMs能够匹敌或超越人类水平的表现,比如在医学和法律领域。

近几个月来,LLMs在应用领域的扩散速度极快,通过新的用例影响着各行各业。内容创作迅猛发展,像Anthropic的Claude和OpenAI的DALL-E这样的工具正在生成营销和广告材料。AI聊天机器人和定制的LLMs现在能够实现类似人类的对话,为客户服务和信息搜索开辟了新的可能性。利用AI进行流程自动化正在消除合同分析(LawGeex)、放射学报告(Nuance)和客户支持交互(Infinity)等领域中的重复性工作流程。在药物发现领域,像BenevolentAI和Exscientia这样的公司正在应用生成式AI加速新药物的开发,有望大大缩短研发时间。围绕内容真实性、聊天机器人的一致性、工作的过度自动化以及生成式AI的未经证实的记录和稳健性仍然存在一些担忧。尽管如此,现实世界中对AI的采用仍在迅速进行。

高管和经理的观点

最近一项由《财富》和德勤进行的CEO调查发现,高管对生成式AI的潜力普遍表现出浓厚兴趣。79%的受访CEO相信这项技术将提高效率,超过一半认为它将提供新的增长机会。超过一半的CEO表示他们正在积极评估和尝试生成式AI。尤其值得注意的是,超过三分之一的CEO表示他们已经在一定程度上开始实施,这表明对于许多公司来说,它正在迅速从实验阶段转向积极应用。

其他调查也证实了企业领导人对生成式AI表现出的相当热情,并且投资规模不断增加。根据普华永道的一项调查,近一半的高管计划投资于这项技术,超过三分之二的人认为它将对他们的商业模式、收入和增长产生重大影响。与此同时,由AI基础设施联盟进行的一项调查发现,超过一半的公司预计在未来一年内,他们的AI投资将带来两位数的百分比收入增长,这表明对生成式AI等技术存在着乐观的预测。这些结果清楚地表明,业务领导人认为生成式AI具有巨大的潜力,可以改变运营并提升利润。

虽然人们普遍对生成式AI将如何影响他们的业务充满信心,但具体的影响方式则较为不明确。麻省理工学院最近的一项调查显示,业务领导人一致认为生成式AI将影响他们的公司。然而,对于具体的影响方式存在不同的看法。最大的一部分(24%)预见到将会有员工减少。其他人则看到对产品的威胁,对新领域的潜在机会,或者需要重新调整人员配置。尽管存在不确定性,大多数人避免悲观的观点,而是采取一种深思熟虑的态度。

评估生成式AI的影响

根据加州大学洛杉矶分校(UCLA)和南加州大学(USC)的一项研究,生成式AI的进步对那些有能力采用这些技术的公司产生了积极影响。研究发现,在ChatGPT发布后,那些与生成式AI有很高的员工暴露度的公司的股票表现优于那些暴露度较低的公司,每日回报率高出0.4%以上。这一效应在各个行业内外都能观察到。随着AI越来越成为越来越频繁的财报电话讨论话题,这项研究验证了一种新的用于评估员工对生成式AI的暴露度的指标。大型语言模型的出现代表了一场对公司价值产生重大影响并制造赢家和输家的技术冲击。这有助于解释为什么高管们对生成式AI的变革潜力感到兴奋。

由于早期研究证明其益处,生成式AI正迅速在高管和经理中获得认可。麻省理工学院的一项研究调查了444名受过大学教育的专业人士在不同职业中(包括市场营销、咨询和人力资源)进行中级写作任务时使用ChatGPT的生产力影响。研究发现,使用ChatGPT导致了显著的生产力提升,输出质量提高了0.4个标准差,所需时间减少了0.8个标准差。值得注意的是,这些提升更多地惠及了表现较差的人。ChatGPT提高了低能力工作者的输出质量,同时减少了他们在任务上花费的时间,也使高能力工作者能够在保持质量的同时更快地工作。总体而言,ChatGPT压缩了生产力分布,减少了工作者之间的不平等。

斯坦福大学和麻省理工学院的研究人员进行的另一项实地研究调查了一种生成式AI对超过5,000名客户服务代理的影响。这项领域研究发现,使用这种AI工具,该工具将GPT与经过对过去对话进行微调的其他模型相结合,以提供实时建议和文档链接,平均增加了代理的生产力14%,以每小时解决问题的数量为衡量标准。初学者和低技能工作者获得的收益最大,其生产力增长了35%,而高技能工作者的影响较小。遵循AI建议更为密切的代理实现了更大的生产力增长。研究还发现,AI改善了客户情绪,提高了员工保留率,并可能导致技能发展,因为即使在意外禁用AI时,代理的表现也更好。

这两项研究共同表明,生成式AI能够带来实质性的生产力提升,而这种提升往往更多地惠及表现较差的人。这些技术似乎能够传播最佳实践,并加速新员工的发展,同时使经验更丰富的员工能够将时间集中在更高价值的任务上。尽管关于工资和就业的长期影响仍有疑问,但这些研究为管理者提供了理由,让他们对生成式AI的谨慎整合带来的潜在生产力和留用效益感到兴奋。虽然需要更多研究,但早期的结果对于工人和企业都是令人鼓舞的。

编程的前沿模型

与普遍印象相反,AI编码助手已经在所有经验水平的开发人员中得到了广泛的应用。最近一项对90,000名开发人员的Stack Overflow调查发现,AI工具被广泛用于编写代码,即使是在经验最丰富的程序员中也是如此。

令人印象深刻的是,在拥有不到1年经验的开发人员中,有84%表示使用AI编码助手,而对于更有经验的开发人员,使用率几乎没有下降。即使在拥有6-10年经验的开发人员中,也有86%表示使用AI编写工具,而在拥有20多年经验的开发人员中,有88%正在利用AI来协助编写代码。

AI在软件开发领域的崛起令人瞠目——仅在2022年,Replit上就创造了近300,000个不同的与AI相关的项目,增长在2023年第二季度加速至160,000个项目,同比增长34倍。新的开发者工具,如LangChain和开源模型,正在推动创新应用的激增,从编写自己代码的自主代理到AI头像,凸显了这项技术的变革潜力。

行业领袖们正在关注这些趋势。在微软首席执行官萨蒂亚·纳德拉的年度信中,他强调了GitHub Copilot等AI编码工具如何为开发人员提供强大支持的例子。OpenAI研究总监安德烈·卡帕西报告说,Copilot以80%的准确度编写了他80%的代码。Mercado Libre发现Copilot将他们开发人员的编码时间缩短了50%以上。微软自己的支持代理也使用Copilot来更快地解决问题。

尽管AI编码助手对新开发人员无疑是有益的,但其功能显然在各个经验水平都得到了认可。数据显示,这些技术如今已成为即使对于经验最丰富的技术专业人员来说也是不可或缺的。通过被最专业的编码人员广泛采用,AI已经从根本上改变了软件开发。

首席数据官的观点

鉴于首席数据官(CDOs)在组织内对数据战略和治理的监督,他们在生成式AI的采用中注定将发挥关键作用。随着组织追求数字转型,生成式AI为简化流程、增强决策制定和创造创新产品和服务提供了独特的机会。

最近亚马逊云服务(AWS)对全球300多位CDOs进行的调查为我们提供了关于他们对生成式AI的看法和准备情况的宝贵见解。尽管采用仍处于早期阶段,但CDOs的热情很高,有93%的人认为数据战略对于发挥这项技术的价值至关重要。

然而,CDOs在充分利用生成式AI方面也面临着重大障碍。其中一个最大的挑战是数据质量。定制的大型语言模型和检索增强生成应用通常对数据需求巨大,需要与手头任务高度相关的高质量数据集。然而,许多组织在数据孤岛和质量问题上存在困扰。近一半的CDOs提到数据质量以及数据隐私和安全作为首要挑战。

另一个担忧是负责任的AI监管。生成式AI模型可能容易受到偏见和错误信息的影响,这可能产生严重后果。CDOs认识到需要治理,调查中将负责任的AI监管和数据隐私/安全作为关切的问题的也接近一半。

尽管存在挑战,CDOs对生成式AI改变业务的潜力感到乐观。正在进行的关键数据倡议包括更多的数据集成、调查数据效用以及为特定领域的应用程序策划文件或文本。总体而言,调查结果突显了CDOs在推动生成式AI采用中发挥的关键作用。随着组织努力将生成式AI从实验转向生产系统,CDOs将负责应对数据挑战、制定数据战略,并实施负责任的AI实践。

生成式AI的主流化加速

生成式AI背后的势头是明显的。除了前面讨论的例子之外,初创公司的融资、工作岗位、专利等方面的趋势都表明了不断增长的主流兴趣。PitchBook的数据显示,与2022年整年相比,2023年前9个月内,生成式AI初创公司吸引了近5倍的投资,截至9月30日,投资金额达到了214亿美元,而去年为43.5亿美元。像“AI专家”这样的职位的招聘在2022年同比增长了50%以上。与生成式AI相关的专利在2022年至2023年间增加了四倍。

从各项指标来看,生成式AI显然是一种迅速崛起的通用技术,已经受到开发人员、高管和经理的热烈欢迎。尽管在风险和长期影响方面仍存在不确定性,但变革潜力解释了围绕生成式AI实现利益的激动。