麻省理工学院近期公布的一份关于《2025年商业AI现状》的研究报告,在商业界掀起了波澜。该报告揭示了一个令人瞩目的现象:尽管已有超过300亿美元资金投入到生成式人工智能(GenAI)领域,但令人惊讶的是,高达95%的企业试点项目未能顺利过渡到生产阶段。
深入探究发现,阻碍这些项目推进的关键因素并非技术局限或法规约束,而在于AI工具的实际应用策略。许多企业在尝试将AI系统融入日常运营时遭遇了难题,这些系统往往缺乏必要的记忆与适应能力,且在长期使用中鲜有改进。因此,尽管在实验室环境下表现出色,但在真实应用场景中却难以达到预期效果。
报告中提出的“GenAI鸿沟”概念尤为引人关注。一方面,仅有约5%的试点项目取得了显著成功,为企业带来了数以百万计的收益;另一方面,绝大多数项目(约90%)却停滞不前,始终无法跨越测试阶段。MIT的研究人员强调,造成这种巨大差距的原因并不在于是否拥有最先进的模型或最强大的计算芯片,而在于如何将这些工具有效地应用于实际工作中。成功的案例通常是将AI系统与真实工作流程紧密结合,并具备持续改进能力的项目;而失败的案例则往往是试图将通用AI技术生硬地嵌入到既有流程中。
尽管像ChatGPT和Copilot这样的通用AI工具已被80%以上的企业尝试,且有近40%的企业在某种程度上进行了推广,但这些工具主要提升的是个人生产力,对公司整体利润的影响并不显著。相比之下,针对企业定制的平台或供应商系统虽然吸引了60%的企业的探索,但仅有20%的项目进入了试点阶段。这些项目失败的主要原因在于工作流程的脆弱性、工具缺乏学习能力以及不符合人们的实际工作习惯。
报告还详细分析了四种主要模式,包括有限的行业颠覆、企业悖论、投资偏见和实施优势。值得注意的是,尽管大型企业推出了最多的试点项目,但在规模化进展方面却往往最为缓慢;而中型企业则能够在相对较短的时间内(约90天)从测试阶段转向推广。报告还指出,大约70%的预算被用于销售和市场营销领域,尽管在后端自动化方面通常能够获得更高的回报。
然而,报告也面临了一些批评。一些质疑者认为,报告中提到的95%失败率缺乏充分的数据支持,且成功与失败的定义存在争议,可能导致一些项目的成果被低估。同时,报告与商业机构的紧密联系也引发了关于研究客观性的讨论。