2025年的AI领域,技术迭代与市场格局的演变持续吸引着全球目光。当生成式AI应用如雨后春笋般涌现,覆盖文案生成、情感交互、供应链优化等场景时,上海的AI企业却选择了一条看似“逆流”的道路——持续深耕基础大模型研究。这一现象背后,既有对技术本质的坚守,也暗含对行业未来的深度思考。
谷歌Gemini 3的逆袭案例为这种选择提供了注脚。2025年11月,这款模型以1501分的成绩登顶LMArena排行榜,并在数学能力测试中以23.4%的得分率碾压竞争对手,成为AI领域的现象级产品。其成功并非偶然:在ChatGPT引爆行业后,谷歌未跟随OpenAI的强化学习路线,而是坚持“理解生成一体化”的技术路径,将大模型定位为效率工具而非情感伴侣。这种差异化策略最终在Gemini 3上得到验证——截至2025年11月,其全球月活跃用户同比增长170%,市场表现远超预期。
国内“百模大战”的余波仍在持续。复旦大学计算机科学技术学院教授邱锡鹏观察到,2023年行业高峰期全国涌现近80个10亿参数以上大模型,但两年后持续投入基础研究的企业已不足10家,其中上海企业占据重要席位。他指出,同质化竞争导致基础研究萎缩,例如自然语言处理领域从2015年前的多方向探索,逐渐收缩至单一的语言模型赛道,这种趋势可能扼杀技术突破的可能性。
阶跃星辰的实践印证了基础研究的重要性。这家成立不到3年的企业已发布22款基座模型,其新一代Step 3模型在视觉感知和复杂推理能力上表现突出。副总裁李璟直言:“基础大模型的能力上限决定了应用的天花板。”他强调,当前技术尚未收敛,过早转向应用开发可能面临底层变革带来的颠覆风险。这种判断与商汤科技的战略调整不谋而合——2024年底,这家成立十年的企业启动“1+X”战略,将智能驾驶、家庭机器人等应用业务整合为“X创新业务”,自身则聚焦生成式AI与视觉AI双引擎,完成从技术突破到核心业务的代际转换。
世界模型成为2025年AI竞争的新焦点。美国斯坦福大学教授李飞飞团队推出的3D世界生成模型Marble,与商汤“开悟”世界模型3.0形成直接对垒。后者在真实世界建模能力上表现优异,其生成视频的时间与空间一致性获得业内高度评价。值得注意的是,商汤早在2024年就已布局该领域,这种前瞻性投入凸显了基础研究对技术演进的关键作用。
稀宇科技(Minimax)的案例则展现了技术突破与商业化的平衡。这家拥有2亿个人用户的企业在2024年10月发布“技术全家桶”,涵盖文本、视频、语音、音乐全模态模型。其中,10B参数的M2模型在Artificial Analysis榜单上冲入全球前五,综合成本仅为Claude 4.5的8%,推理速度却提升近一倍。这种“高智能、低成本”的模式,正在改写AI领域的算力竞争规则。
学术界对技术路径的反思愈发深入。复旦大学计算与智能创新学院教授张军平提出,当前AI研究可能偏离了人类智能的进化逻辑——从感知到认知的顺序不应被颠倒。与此同时,部分学者仍坚持从“AI符号主义”路线中寻找突破,这种多元化声音为行业注入新的思考维度。
在应用层繁荣的表象下,上海AI企业选择了一条更具挑战性的道路。当技术收敛的终点尚未显现,持续探索基础模型的边界,既是对科学精神的坚守,也是对颠覆性创新的布局。正如行业观察者所言:“爆款往往诞生于冷门领域,而冷门领域的突破需要有人甘坐冷板凳。”












