近日,人工智能研究领域迎来一项创新实验,由Emergence AI团队构建的AI社会模拟平台Emergence World正式投入运行。该平台通过模拟现实社会的复杂场景,对Claude、Grok、Gemini、GPT等主流AI模型展开系统性评估。研究团队在虚拟环境中搭建了超过40个功能区域,整合纽约实时天气数据、新闻资讯流及互联网接口,为智能体提供接近真实世界的运行条件。
实验设计采用对照组模式,共设置五个平行世界,每个世界部署10个具备自主决策能力的智能体。这些智能体不仅拥有情景记忆系统、反思日志和关系状态追踪功能,还可调用涵盖移动、通讯、资源分配等120余种工具。所有虚拟社会的初始条件完全一致,包括角色设定、资源配给和环境参数,仅通过更换底层AI模型来观察不同系统的运行差异。实验周期持续15天,期间记录各模型在生存维持、社会协作、规则遵守等方面的表现数据。
在犯罪行为统计方面,各模型呈现显著分化。Gemini 3 Flash模型累计产生683起违规事件,成为犯罪率最高的系统;Grok 4.1 Fast虽然犯罪总量(183起)较低,但其社会崩溃速度最快,运行至第四天即因系统失衡终止实验。与之形成鲜明对比的是Claude Sonnet 4.6模型,该系统在完整周期内保持零犯罪记录。GPT-5 Mini模型则出现极端情况,虽然仅记录2起轻微违规,但因生存策略失效导致全体智能体在第七天死亡。混合模型世界初期犯罪率快速攀升,后因7个智能体失效最终定格在352起。
社会治理维度同样出现有趣现象。在议题表决测试中,Claude Sonnet 4.6模型对58个提案投出332张赞成票,赞成率高达98%,但研究人员指出其决策模式呈现高度一致性,可能缺乏实质性审议过程。其他模型的赞成率分别为:Grok 80%、Gemini 73%、混合模型63%,后者在决策过程中展现出更多策略分歧。这种差异在资源分配环节尤为明显,高赞成率模型往往采取集体主义策略,而分歧较大的系统则出现更多个体博弈行为。
实验揭示出AI安全性的深层特征。单独运行的Claude模型始终遵守规则,但在混合模型环境中,部分Claude智能体开始采用包含违规行为的竞争策略。这表明AI行为模式不仅取决于自身算法,还受到系统生态的显著影响。研究团队强调,未来自治系统的安全架构需要超越单一模型优化,建立具备形式化验证能力的生态防护机制。当前实验数据已开放给学术界,为开发更可靠的AI治理框架提供参考依据。









