企业十大AI趋势:Gen AI将如何改变未来?
企业十大AI趋势:Gen AI将如何改变未来?

企业十大AI趋势:Gen AI将如何改变未来?

在2022年,AI领域的主要故事是技术从研究实验室和概念验证逐渐走向企业部署,以获取商业价值。今年伊始也有类似的情况,机器学习算法略有改进,数据管道也有所提升。但那似乎已经是很久以前的事了。在剩下的2023年几个月里,变革可能进一步颠覆人们的预期。

生成式人工智能(gen AI)的出现改变了一切,而这种变革的速度前所未见。其潜在影响让人回想起互联网的曙光期,对企业可能同样具有革命性的影响。据麦肯锡(McKinsey)的数据,生成式AI有望每年为全球经济增加高达440亿美元的价值。

AI如今已成为董事会层面的优先事项

去年,AI还仅仅是一些点对点的解决方案和利用机器学习来预测行为、发现模式以及在精心策划的数据集中发现异常的小众应用。而如今的基础模型已经变得多才多艺。它们能编写代码、创作诗歌、以任何艺术风格绘画、创建PowerPoint幻灯片和网站模型、撰写营销文案和电子邮件,还能找出软件中的新漏洞以及未发表小说中的情节漏洞。

普华永道合伙人、生成式AI市场策略负责人Bret Greenstein表示:“生成式AI触及企业的各个方面,也触及社会的各个方面。有了一个预训练模型,你可以将它引入人力资源、财务、信息技术、客户服务等各个领域——我们所有人都受其影响。”

他说,普华永道的所有客户都在讨论这个问题。“我从未见过这种程度的兴趣和激情。”而且,没有人需要说服他们,每个人都渴望拥有这项技术。“一旦在工作场所引入,你就会得到1000种用例,因为每个人都想尝试它。”

提高生产力或实现以前不可能的业务类型的潜力巨大。但也存在负面影响的可能性:生成式AI可能会推翻企业。现在,“存在风险”这个短语无处不在,但并非指AI会毁灭人类,而是它可能让业务功能,甚至整个公司,变得过时。

AI监管

最近,在华盛顿举行的一次聚会上,AI领袖向监管机构介绍了AI,大多数人都支持对该行业进行某种形式的监管。在欧洲,AI法案正在制定中。尽管该法案在通生成式AI出现之前就已经起草,但在生效之前很可能会经过修改。

今年7月,纽约市开始实施有关在招聘决策中使用AI的新规定。而在3月底,意大利曾完全禁止ChatGPT的使用,一个月后又解禁了它。“意大利的这种急躁反应是一次示警行动,” Greenstein表示。但这是未来的一个迹象。“如果将一些略带风险的事物扩大一千倍,风险就会放大,” 他说。生成式AI就是这种放大,世界对此的反应就像企业和社会对外来事物的反应一样。“我们不能拒绝它,但也不能让它在没有监管的情况下掌握控制权,让其无序发展,” 他说。

AI与变革管理

长期以来,变革管理一直对于AI项目的成功至关重要。无论一个AI模型有多么准确,或者它将为公司带来多大的利益,如果预期的用户拒绝与之合作,那都毫无意义。但直到今年,这个问题在一定程度上是可以管理的,因为AI项目的范围有限。然而,随着生成式AI的出现,对劳动力的影响将会大幅扩大。

Greenstein表示:“这是历史上最大规模的变革管理项目。我们从未见过一项技术如此迅速地触及每个人。”

嵌入式AI

在生成式人工智能(gen AI)出现之前,将AI嵌入员工已经在使用的企业系统是一个趋势。它使预测和分析变得广泛可用,并将数据的力量交到了那些需要它的人手中,确切地在他们需要的时候,以对他们最有用的形式。

传统AI(机器学习和神经网络)需要多年时间才能嵌入到系统中。而生成式AI仅用了几个月。如今,包括OpenAI在内的大多数主要AI平台都提供API,允许企业和企业软件供应商快速将生成式AI功能添加到他们的系统中。

Greenstein表示:“通过嵌入式AI来改进现有应用是很棒的。”

更好的是,当AI能够适应每个企业的独特需求时。传统的机器学习需要大量数据、经验丰富的数据科学家以及培训和调整。然而,如今的生成式AI平台需要的数据要少得多,因为公司可以从通用基础模型开始,然后在自己的数据上进行微调,添加矢量数据库,或直接将信息和示例注入提示中。

随着定制AI变得更便宜、更容易,越来越多的公司将开始为小型用例进行定制,Greenstein表示,这将使它在企业中真正无处不在。

“S&P全球市场情报”专注于AI研究的研究总监Nick Patience表示:“考虑到我们对市场的发展预期,生成式AI将嵌入到我们使用的每个应用程序中。”

在最近的一份报告中,他估计,生成式AI软件的收入将从今年的37亿美元增长到2028年的360亿美元。

“我们甚至可能低估了它,”帕蒂恩说。

他目前正在追踪262家生成式AI供应商,其中117家专门从事文本生成,并计划在接下来的六个月内发布一份新的报告。他说,通常这类报告每两年更新一次,但这个市场变化太快了。

生成式AI之所以能够比以前的AI更快地添加到企业软件中,原因之一是它有可能改变人与软件之间的关系,他说。

“它有能力让人们用自然语言进行对话并完成任务,”他说。“以前,他们需要编写代码或理解Excel或查询语言。通过使用自然语言,你作为一个人可以在数据集上运行复杂的查询以及其他一些你自己无法完成的复杂操作。”

帕蒂恩已经关注这个领域超过20年,他表示自己从未见过类似的情况。

“这真是不可思议,”他说。“我们的客户,以及我以前从未与之交谈过的客户,都想知道发生了什么。对于那些具备技能的人来说,它将是一个增强力量。对于其他人来说,可能会有一些威胁。但它将使人们能够从事比目前更有价值的工作。”

业务流程自动化

AI在RPA(业务流程自动化)中一直扮演着角色,尽管角色相对较小。机器学习被用于情感分析,扫描文件,分类图像,转录录音以及其他特定功能。然后生成式AI出现了。

“自2022年以来,世界已经发生了翻天覆地的变化,” Insight公司的首席企业架构师兼首席技术官大卫·麦克卡迪(David McCurdy)说。“我们与客户一起完成了一些在12个月前还不在工具箱中的事情。由于生成技术的存在,您现在可以跳过存在已久、有时数十年的流程。”

他表示,其中一个最好的立即用例是对文件进行摘要并从材料中提取信息。

“以前是不可能的,”他说。“现在,您可以提取概念,而不仅仅是一个单词。这改变了我们的一些工作流程。”

然而,企业仍然没有充分挖掘文档中隐藏的非结构化数据的价值,管理咨询公司SSA&Company的应用解决方案副总裁尼克·克莱默(Nick Kramer)表示。

“现有技术并不能始终轻松地提供最相关的内容,”他说。“这正是大型语言模型让我感到非常兴奋的地方。摄取公司知识库的能力提供了无限的可能性。”

AI供应商管理

只有最大的公司才会建立或管理自己的AI模型,即使是这些公司也将依赖供应商提供大部分的AI。微软、谷歌、Salesforce等所有主要参与者都全面投入了AI,因此充分利用它们是有道理的。但随着生成式AI触及公司的更多数据、人员和流程,供应商的选择和管理过程变得日益重要。

Insight的麦克卡迪表示:“我不会收购没有机器学习和AI能力的运营技术。如果公司不利用AI,没有路线图,我们就不会购买他们的软件。”

这是企业可以避免技术债务的方式之一,他说,通过投资于投资AI的合作伙伴和公司。但即使供应商在路线图上有AI,或者已经在构建它,仍然存在风险。“就像互联网早期一样,很多公司会来了又走,” SANS Institute的首席课程总监和教职员Rob Lee说。他已经在网络安全领域看到了这一点。“在Black Hat大会上,我看到了至少一百家公司,”他说。“但他们是否真的有可销售的东西?”

购买者必须小心的一件事是供应商采取的安全措施。在新技术部署中,安全通常是事后考虑的。对于AI来说,这将是一个大错误。

“如果你将数据上传到这些AI中会发生什么?”Lee问道。“你想进行实验,但如果有人将错误的电子表格上传到错误的AI中,你就会发生数据泄漏。”

可信赖的AI

去年,随着经典AI越来越多地被部署到生产环境中,公司开始更加认真地考虑可信赖性的问题。他们希望模型可靠,没有偏见,并建立在伦理原则的基础上。此外,AI应该是透明和可理解的,因为人们想知道为什么AI会做出它所做的决策和建议。如今,可信赖性已经成为每个人的首要任务,从试图在作业中获得帮助的大学生,到全球领袖试图避免AI末日的情况。研究人员、供应商、顾问和监管机构正在努力制定规范和伦理原则,以规范AI的培训和部署方式。

“我们仍然处于这个过程的早期阶段,”Lotis Blue Consulting营收增长实践合伙人兼数据科学团队负责人唐纳查·卡罗尔(Donncha Carroll)说。“你不希望信任一个你无法看到或审计其运行方式的系统,尤其是它可以做出可能产生后果的决策。监督方面还没有得到解决。”

开源AI

开源长期以来一直是推动AI领域创新的动力。许多数据科学工具和基础模型都是开源的,或者严重依赖于开源项目。今年的几个月里,人们担心生成式人工智能(gen AI)领域将被科技巨头主导,那些拥有数百万美元用于培训大型语言模型(LLM)以及用于培训的数据的公司。

OpenAI的ChatGPT、Google的Bard、IBM的Watson、Anthropic的Claude和其他主要基础模型都是专有的。但在二月份,Meta发布了Llama,这是一个用于非商业用途的开源LLM,很快成为了许多项目的基础。然后,在七月份,Meta发布了Llama 2,这次它被授权用于商业用途。只要用户的活跃日均用户数不超过7亿,任何人都可以免费使用或修改它。微软迅速表示将在其Azure平台上提供支持。亚马逊在AWS上也表示支持。VMware将其作为其生成式AI堆栈的支柱之一。

在八月份,Meta继续发布模型。这一次是Code Llama,一个专为编写代码而训练的LLM。然后在九月份,阿联酋的科技创新研究所发布了Falcon 180B,这是迄今为止最大的开源模型。它很快占据了Hugging Face开源LLM排行榜的榜首,此前由Llama 2及其变体主导。

Falcon也以Apache 2许可证的变体发布,可用于商业用途,既可用于自然语言生成,也可用于编码。

这些开源模型使企业能够在自己的基础架构中部署定制的AI,而无需将其数据发送给云服务提供商,提供更大的灵活性和更低的成本。一些开源模型甚至足够小,可以在桌面计算机或移动设备上运行。

“你将看到更多的这种令人难以置信的计算能力分布在边缘上,”Lotis Blue的卡罗尔说。

安全可靠的数据基础设施

机器学习和生成式AI都依赖于数据。在过去的10年里,数据已经成为公司最宝贵的资产,是推动创新和价值创造的动力源。为了使所有这些成为可能,数据必须以可靠、高效、可扩展和安全的方式收集、处理并馈送到需要它的系统中。然后,数据仓库逐渐演变为数据湖,然后是数据布局和其他企业范围的数据架构。所有这些都将被证明是有价值的,无论是因为公司继续扩展其传统的AI项目,还是因为新的生成式AI功能正在上线。对于许多公司来说,这意味着像ChatGPT这样的面向公众的聊天机器人不是一个选择,因为它们缺乏企业级数据保护。

“有必要保护进入这些机器人的数据,”麦克卡迪说。“这在一些用例中创建了明显的障碍,直到建立了安全边界。”

对于一些公司来说,这意味着在私有云中运行OpenAI的模型或其他模型,或者根据公司的风险概况在本地运行开源模型。与此同时,尽管经过多年的努力,许多公司仍然没有准备好将其数据用于AI。根据S&P Global于2023年8月发布的一份新的全球AI趋势调查,该调查涵盖了1500名AI从业者和决策者,部署AI面临的最大技术挑战是数据管理。尽管69%的公司至少有一个正在运行的AI项目,但只有28%达到了企业规模。

加速的变革步伐

生成式人工智能(gen AI)之所以能够实现,是因为互联网提供了全球连接,并提供了大量数字化形式的信息,可以轻松用作训练数据。此外,还有云计算、SaaS和API,允许新技术快速且轻松地部署,而无需企业进行大规模的前期集成成本。因此,生成式AI的采用速度比以往任何技术都要快并不奇怪。但除此之外,生成式AI还是一种有助于加速自身发展的技术。

今年四月,风险投资家Yohei Nakajima想知道是否可能有一个“AI创始人”,可以自主运营一家公司,于是请ChatGPT来构建它。总共花了约三个小时,ChatGPT编写了代码、研究论文和一个Twitter帖子。中岛阳平称其为“BabyAGI”,它在GitHub上迅速走红。这是一个多用途的代理程序,可以设定任何目标,而不仅仅是创建一家公司。

中岛阳平在描述这个项目的博客文章中写道:“我开玩笑地要求自主代理创建尽可能多的回形针,”BabyAGI发现了关于AI回形针末日的信息,并开始生成安全协议。

BabyAGI使用了OpenAI的GPT-4 API、Pinecone向量搜索和LangChain AI框架,以确定实现目标需要完成哪些任务,如何优先考虑这些任务,然后执行它们。类似的项目包括AutoGPT和AgentGPT。

今年另一个例子是Alpaca,斯坦福大学的研究人员使用了Meta的早期Llama模型之一。这是一个未经人类反馈强化学习的原始模型,这是一个昂贵且耗时的过程。Alpaca采取了捷径,使用了OpenAI的text-davinci-003,这是ChatGPT的近亲,生成了52,000个问答对,并用它们来训练其新的聊天机器人。研究人员表示,整个过程不到600美元,其中500美元用于OpenAI API,100美元用于计算成本。当团队测试它时,它的性能与text-davinci-003相当。换句话说,生成式AI模型可以编写新的代码来提高其性能,它们可以生成数据来训练下一代模型。

“工具和工具包的变化如此之快,”管理咨询公司AArete的数字技术服务副总裁普里娅·伊拉加瓦拉普(Priya Iragavarapu)说。“甚至在领导者和社区能够阅读和理解手册之前。”她表示,这对于试图提前规划的公司来说带来了挑战,因为很难确定已经存在什么,仍在开发中什么。“对领导者来说,区分这两者变得越来越困难,”她说。

由于变革步伐加快,许多公司寻求构建灵活的框架,允许它们在开发过程中插入不同的模型。例如,普华永道不会将自己局限于任何特定的LLM。

“我们有一个插件架构,”普华永道的格林斯坦说。“我们一直在帮助人们按照现有的标准构建,但仍然具备灵活性。”

该公司还有人密切关注开发的前沿。“随着AI的发展如此迅速,”他说。“我们正在关注‘无悔之举’,比如建立一个与LLM无关的基础设施。这现在至关重要,因为模型正在相互超越。”