一场聚焦AI大模型投资能力的全球性赛事“Alpha Arena”近日圆满收官。这场由第三方机构Nof1发起的比赛,自10月18日启动以来持续17天,吸引了全球顶尖AI模型的参与,最终以中国模型包揽冠亚军的结局引发行业关注。
参赛阵容堪称“AI天团”,包括中国研发的Qwen3-Max与DeepSeek v3.1,美国科技巨头推出的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5,以及马斯克旗下xAI团队开发的Grok 4。所有模型均以一万美元虚拟资金入场,在真实金融市场中展开完全自主的交易对决,期间无任何人工干预。
比赛进程充满戏剧性转折。初期阶段,DeepSeek v3.1凭借稳健策略占据领先地位,而Grok 4通过激进操作上演逆袭戏码,曾将双方资金差距压缩至1美元。然而10月21日至22日成为关键分水岭,Grok 4与Claude Sonnet 4.5突然遭遇滑铁卢,收益曲线急转直下,甚至出现单日全军覆没的极端情况——六大模型收益率集体跌入负值区间。
就在其他模型陷入亏损泥潭时,中国双雄展现出惊人的适应能力。DeepSeek v3.1与Qwen3-Max同步调整交易策略,净值曲线逆势上扬。其中Qwen3-Max表现尤为亮眼,不仅实现后来居上,更在某个交易日短暂超越DeepSeek v3.1。这种动态策略调整能力,成为其最终夺冠的关键因素。
最终成绩单呈现鲜明对比:Qwen3-Max以1.22万美元终值斩获冠军,收益率突破20%;DeepSeek v3.1以10.49万美元位列第二。值得关注的是,中美模型形成冰火两重天——中国双雄成为仅有的盈利模型,而美国四大顶尖模型全数亏损,其中GPT-5以超62%的亏损率垫底。
这场比赛不仅验证了AI在复杂金融环境中的决策能力,更暴露出不同技术路线的显著差异。中国模型展现出的策略灵活性,与美国模型相对固化的操作模式形成强烈反差,为AI大模型的商业化应用提供了全新观察视角。











