港股市场近日迎来一场资本狂欢,一家专注AI模型研发的企业凭借新一代产品引发市场强烈关注。2月首个交易日,该公司股价单日飙升14.52%,市值突破3000亿港元大关。这场行情并非单纯的市场情绪波动,而是技术突破与产业需求共振的直接体现。
过去两年,AI行业聚焦于模型算力、芯片性能等供给侧技术突破,但真正制约产业发展的瓶颈在于应用场景的落地难题。春节期间,该公司发布的M2.5模型成功打通了这一环节。该模型上线12小时即登顶OpenRouter热度榜,一周内调用量突破3.07T tokens,相当于同期三家头部模型调用量总和。更值得关注的是,其带动了100K至1M长文本区间的增量需求,这正是智能体(Agent)工作流的核心消耗场景。
技术突破的背后是工程架构的彻底重构。该公司研发的Forge原生强化学习系统,通过引入标准化通信网关和异步数据池,将智能体执行逻辑与底层训练引擎解耦。这种设计使模型能够无缝接入数百种框架和工具调用格式,训练效率提升40倍的同时降低显存消耗。在算法层面,复合奖励机制将过程监督、时效优化和回报标准化相结合,有效解决了长序列任务中的注意力稀释问题。
市场表现印证了技术路线的正确性。OpenRouter平台数据显示,M2.5发布后带动整体调用量同步攀升,特别是在智能体开发领域形成示范效应。硅谷新锐AI编程工具Kilo Code在核心产品中优先采用该模型,其联合创始人直言:"在真实编码场景中,M2.5的性能表现与前沿模型不相上下。"包括OpenClaw、Fireworks在内的十余个国内外开源项目,均在第一时间完成模型接入。
性能与成本的平衡成为关键胜负手。M2.5提供两个版本选择:100 TPS快速版输入成本低至每百万tokens 0.3美元,输出成本2.4美元;50 TPS版本输出价格再降50%。这种定价策略精准击中开发者痛点,使得原本受限于成本的复杂多智能体系统具备商业可行性。研究机构实测显示,在8张H200显卡环境下,该模型可稳定维持每秒2500 tokens的吞吐量,即便处理万级token上下文仍能保持解码速度。
技术迭代速度形成降维打击。过去三个月内,该公司连续推出M2、M2.1和M2.5三代模型,在SWE-Bench编程基准测试中通过率从62%跃升至80.2%,超越Claude Opus系列并登顶多语言任务榜首。独立评测显示,其开源版本性能仅次于两家闭源巨头,成为开发者首选替代方案。这种迭代效率在OpenRouter生态中催生连锁反应,上千个新型工具和应用正在这个非"御三家"体系中快速生长。











