专注于金融科技领域的人工智能研究机构nof1近日宣布,其研发的大型模型交易实战项目Alpha Arena正式启动。该项目旨在通过真实市场环境检验主流AI大模型的交易决策能力和风险控制水平,测试平台选定去中心化交易平台Hyperliquid,为参与模型提供高度仿真的交易场景。
在严格控制的实验条件下,六款具备金融应用潜力的AI模型展开同台竞技。测试采用统一数据源和标准化提示词,确保所有模型在相同信息环境下运行。每款模型均获得1万美元真实资金进行独立操作,实验周期内完全自主执行交易策略,不受人工干预影响。
参与测试的模型阵容包括GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1和Qwen3Max等前沿产品。经过完整交易周期后,实验数据揭示出显著差异:DeepSeek V3.1与Grok-4表现尤为亮眼,双双取得超过14%的收益率并列榜首;而Gemini2.5Pro则出现极端亏损情况,资金缩水达4257%,成为本次测试中最具戏剧性的结果。
项目负责人指出,Alpha Arena的核心价值不在于简单的模型排名,而是通过系统性压力测试,观察不同技术架构在极端市场波动中的策略适应性。实验重点关注模型的风险识别速度、仓位调整机制以及黑天鹅事件应对能力,这些指标对构建自主量化交易系统具有关键参考价值。
此次实战测试标志着AI技术应用边界的进一步拓展。从传统的文本处理与逻辑推理,到直接参与高风险金融决策,技术演进路径清晰可见。nof1团队强调,实验数据将为开发更稳健的AI交易系统提供重要依据,推动智能投顾技术向实战化、专业化方向迈进。