当AI应用如雨后春笋般涌现,从智能文案生成到情感陪伴机器人,从供应链优化到虚拟场景构建,技术红利似乎已触手可及。然而,在这场全民狂欢中,上海多家人工智能企业却选择了一条少有人走的路——持续深耕基础大模型研发。这种看似“逆潮流”的坚持,正在重新定义中国AI产业的竞争格局。
2025年11月,谷歌凭借新一代模型Gemini 3在全球AI领域掀起巨浪。该模型不仅在LMArena综合评测中以1501分登顶,更在数学推理等高难度任务中展现出碾压式优势,将OpenAI等竞争对手远远甩在身后。这场胜利被业界视为“技术耐力的胜利”——在ChatGPT引爆行业后,谷歌并未盲目追随强化学习路线,而是坚持“理解生成一体化”的技术路径,最终通过持续迭代实现质的飞跃。数据显示,Gemini 3发布后全球月活用户同比增长170%,证明基础研究的突破能直接转化为市场竞争力。
这种坚持在中国同样引发共鸣。复旦大学计算机科学教授邱锡鹏观察到,2023年“百模大战”期间,国内大模型同质化现象严重,尽管名称各异,但核心技术路线高度趋同。更令人担忧的是,自然语言处理等基础领域的研究投入反而出现萎缩。“当所有人都涌向语言模型这条独木桥,真正的创新可能就被扼杀了。”他指出,谷歌的案例证明,在技术路线选择上保持战略定力至关重要。
成立不到三年的阶跃星辰是这种理念的践行者。该公司已累计发布22款基座模型,其最新推出的Step 3模型在视觉感知和复杂推理能力上达到新高度。副总裁李璟坦言:“基础大模型的能力边界决定了所有应用的天花板。在技术路线尚未收敛的当下,过早转向应用开发可能面临底层技术迭代带来的系统性风险。”这种判断源于对行业规律的深刻理解——历史上每次技术范式转换,都会使大量应用层创新迅速贬值。
老牌AI企业商汤科技的转型更具标志性意义。2024年底,这家成立十年的公司启动战略重组,将智能驾驶、家庭机器人等应用业务整合为“X创新业务”,自身则聚焦生成式AI与视觉AI双引擎。这种“减法”背后是清晰的战略判断:生成式AI已从技术突破点转变为核心增长极。2025年,当世界模型成为新焦点,商汤提前一年推出的“开悟3.0”模型凭借出色的时空建模能力,与斯坦福大学World Labs的Marble模型形成直接竞争,印证了其技术前瞻性。
在消费级市场取得巨大成功的稀宇科技(Minimax)则展示了另一种可能。这家拥有2亿个人用户的企业,在2025年10月同步升级了文本、视频、语音和音乐四大模态模型。其中,仅有100亿参数的M2模型在权威评测中冲入全球前五,而其综合成本仅为竞争对手Claude 4.5的8%,推理速度却提升近一倍。这种“小参数、高性能”的技术突破,正在改写AI领域的资源分配规则。
学术界的反思为这场讨论增添新维度。复旦大学张军平教授提出,当前AI研究可能偏离了人类智能的进化路径——先发展感知能力再提升认知水平,才是更自然的演进方向。与此同时,部分研究者开始重新审视IBM沃森机器人代表的符号主义路线,试图在神经网络与符号推理之间寻找新平衡。这些“非主流”声音的复苏,预示着AI技术可能迎来新的范式转换。
当行业普遍追求短期变现时,上海AI企业的选择显得尤为珍贵。它们用实际行动证明,在技术变革期,保持对基础研究的敬畏与投入,既是应对不确定性的最佳策略,也是实现颠覆性创新的前提条件。正如一位从业者所言:“在算力可以购买、数据可以获取的今天,真正的护城河在于对技术本质的理解和坚持。”这种坚持,或许正是中国AI产业走向全球舞台中央的关键密码。








