随着人工智能大模型技术的快速迭代,从底层基础设施到上层应用的创新竞争已成为全球科技发展的核心焦点。行业观察人士普遍认为,尽管基础大模型的数量将逐步减少至有限个位数,但垂直领域模型与应用将迎来爆发式增长,这将成为本轮技术革命的关键突破口。其中,物理AI作为连接数字与实体世界的重要桥梁,正推动具身智能、自动驾驶等领域加速突破,但其技术路径分歧与落地挑战仍待解决。
物理AI领域近期因Sora模型的发布引发激烈讨论。该模型通过高度逼真的物理世界视频生成能力,将"世界模型"与"视觉语言模型(VLA)"的技术路线之争推向台前。中兴通讯首席发展官崔丽分析指出,Sora的出现标志着AI从"预测者"向"模拟者"进化,但当前仍属于"视觉模拟器"范畴。真正的物理世界模型需具备因果推理、反事实推演和物理一致性三大核心能力,而现有生成式模型因依赖像素统计相关性,常出现动量守恒违背、物体凭空消失等"物理幻觉",且功能侧重于视觉渲染而非决策所需的物理状态预测。
技术路线分化方面,世界模型领域已形成"生成派"与"表征派"两大阵营。前者以Sora和李飞飞团队开发的Marble为代表,通过海量视频数据归纳世界规律;后者以杨立昆提出的JEPA架构为核心,强调通过模块化设计构建内在表征。崔丽认为,生成派更适合数据工厂和仿真训练场景,而表征派在实时决策推理中更具优势。在具身智能领域,VLA模型与世界模型的竞争本质是"智能本质是直觉还是推理"的哲学之争。VLA通过序列建模实现零样本泛化,但缺乏因果推理能力;世界模型则通过虚拟试错提升样本效率,二者正呈现融合趋势。
网络架构层面,AI技术正驱动从"云原生"向"AI原生"转型。崔丽指出,云原生架构解决了互联网应用的弹性伸缩需求,但大模型时代带来的分布式同步计算特征,对网络提出"万无一失"的新要求。AI原生网络需具备内生智能、确定性保障和算网一体等特性,其核心从资源虚拟化转向性能无损与算网协同。在应用层面,云原生以K8s和微服务通信为基础,AI原生则以"大模型+Agent"架构为核心,二者融合将催生云智一体原生应用。
2025年被业界称为"Agent元年",这项技术正推动各行业从效率提升迈向业务重构。崔丽观察到,AI技术已从Copilot辅助模式转向Agent自主行动模式,但规模化落地仍面临多重挑战。在电信、金融等高可靠性行业,随机性模型与确定性业务的矛盾、长程任务稳定性、可信安全边界等问题亟待解决。上下文窗口限制导致的记忆丢失、工具调用引发的安全风险,以及复杂IT环境中的接口标准化缺失和数据孤岛现象,均构成技术落地的现实障碍。
哪些行业将率先实现AI价值规模化复制?崔丽总结了六大关键特征:信息密集度高、数据结构化完善、反馈机制强、价值闭环迅速、具备容错能力、拥有泛化潜力。制造业凭借结构化数据环境和明确效率指标成为先行者,城市治理通过"城市智能体"模式实现从被动响应到主动预防的跨越。当转型进入"深水区",AI开始渗透网络运营、电网调度等核心业务流,面临多模态数据、多厂家设备、多业务场景的"三多"挑战,以及新技术融合、新架构协同、新安全威胁的"三新"考验。
在技术路径选择上,崔丽提出"云边协同"的混合方案。通用基础大模型通过行业精调构建企业"大脑",解决认知层面的通用性与专业性矛盾;行业专属小模型则专注非自然语言数据、极致边缘场景和隐私敏感领域,构建企业"四肢"。她特别指出,工业振动波谱、雷达信号等特殊数据需要专用模型处理,矿山无人驾驶等场景对时延的严苛要求也迫使采用轻量化小模型。对于金融等对数据主权有极致要求的领域,完全物理隔离的从零训练成为必要选择。这种混合路径既保证了认知层面的高效迁移,又满足了执行层面的精准适配。











