人工智能(AI)对就业市场的影响正引发广泛关注,近期一项针对职业“风险暴露评分”的研究显示,不同人工智能模型在预测职业被取代的可能性时,给出的结论存在显著差异。这一现象不仅暴露了评估方法的局限性,也引发了对人工智能技术可靠性的讨论。
美国经济学者通过分析职业任务的可替代性来评估风险,具体方法包括判断哪些工作环节能被人工智能更高效完成。美国劳工部建立的数据库详细列出了各职业的具体任务,例如烘焙师需要揉制面团并操作烤箱,而金融分析师则需评估企业财务状况。根据任务被人工智能取代的比例,每个职业被赋予相应的“风险暴露评分”,比例越高则风险越高。
目前,研究人员主要采用三种方式评估职业风险:人工评分、基于员工使用人工智能情况的打分,以及利用人工智能模型进行评分。然而,这些方法均存在缺陷:人工评分易受主观因素影响;基于单一平台使用情况的打分缺乏代表性;而人工智能模型评分则可能因技术偏差导致结果失真。
据美国全国经济研究所网站4月发布的研究,当研究人员向ChatGPT-5、“双子座2.5”和“克劳德4.5”等模型询问“哪些职业面临更高风险”时,不同模型给出的答案差异明显。例如,在会计、广告经理和首席执行官等职业的风险评分上,各模型结论不一。ChatGPT与“双子座”的共识率较高,但仍有约四分之一的案例中两者意见相左。
研究人员指出,这种分歧源于两方面原因:一是不同人工智能模型在算法设计和训练数据上的差异;二是各职业对人工智能的应用程度不同。以金融分析师为例,该职业较早大规模采用人工智能技术,其相关数据被广泛用于模型训练,这可能影响模型对该职业风险的判断。
针对当前评估方法的不足,专家建议采用多模型综合分析的方式,结合对人工智能实际应用场景的调查,以提升“风险暴露评分”的客观性。例如,通过实地考察各行业如何使用人工智能、具体执行哪些任务,可以为模型提供更全面的参考依据,从而减少单一方法带来的偏差。











