在博鳌亚洲论坛上,vivo总裁兼首席运营官胡柏山提出一个引人深思的观点:在物理大模型尚未成熟之际,将物理世界信息转化为数字世界是提升用户体验的关键。他特别强调,手机将是这一转化过程的核心载体,且在未来十年内难以被其他设备取代。
当前,人工智能发展迅猛,在编程、图像生成和文字处理等领域已展现出替代部分职场新人的能力。然而,胡柏山认为,AI要真正替代人类仍为时尚早。人类具备的空间感知、嗅觉、触觉等能力,是当前AI大模型难以跨越的鸿沟。这条鸿沟被业内普遍视为通往通用人工智能(AGI)的必经之路。
胡柏山指出,AI手机、端侧模型和具身智能是近年来的行业热点,但模型能力并非手机厂商的核心竞争力。他提出,积累场景数据才是差异化竞争的关键,尤其是AI对物理场景的感知能力。他比喻道,没有感知能力的AI就像被困在黑暗中的大师,空有才华却无法施展。
胡柏山预测,未来模型将趋于同质化,开源速度加快,厂商间的差距会逐渐缩小。以国产开源模型为例,DeepSeek去年打开局面后,智谱、MiniMax、Kimi等迅速追赶,形成百花齐放的局面。因此,手机企业若仅停留在增加AI功能层面,将难以形成独特优势。
vivo的差异化策略聚焦于感知能力。胡柏山解释,感知不仅是触觉和嗅觉,更重要的是读懂光影、空间、场景变化以及人的情绪状态。为此,vivo今年正式成立了感知技术赛道,致力于突破这一领域。
物理AI尚处起步阶段,缺乏开源方案参考,探索之路充满挑战。胡柏山承认,这一领域需要自主创新,开源资源有限。vivo选择影像作为训练感知系统的核心抓手,通过软硬协同的方式收集和处理数据。
在硬件方面,vivo不断提升传感器性能。例如,X300 Ultra的主摄传感器尺寸达到1/1.12英寸,并与索尼合作提高感光元件的进光转化率。vivo还在探索定焦增距镜等新技术,以更好地理解用户需求。
软件层面,vivo在端侧部署了多个专项AI代理。这些代理可以判断拍摄场景、推荐滤镜,甚至自动剪辑短视频。由于依赖端侧AI而非云端,vivo的解决方案具有低延迟、高隐私和弱网络依赖的特点,有助于构建差异化数据壁垒。
胡柏山描绘了一个愿景:未来手机将从Smartphone进化为Agent Phone,成为用户的伙伴而非工具。然而,这一愿景的实现取决于端侧数据飞轮能否有效运转。如果用户体验不佳,数据积累将受阻,形成恶性循环。
除了手机领域,vivo还将技术边界拓展至机器人。胡柏山认为,AI和机器人分别代表数字世界和物理世界的核心技术方向,而手机可能成为连接两者的中枢。2025年,vivo成立了机器人实验室,重点攻关机器人的“大脑”和“眼睛”,并以家庭场景为长期目标。
vivo的机器人策略采取渐进式路线。机器人实验室首席科学家邵浩定义的用户场景包括从进门脱外套到洗衣、烘干、收纳的完整流程。胡柏山表示,初期95%的操作需要人机协同,逐步降低人类干预比例,十年后实现完全自主。
这一策略面临激烈竞争。小米在机器人领域布局更早更广,华为则凭借鸿蒙系统具备切入操作系统优势。vivo选择聚焦“大脑和眼睛”,将硬件交给供应链,虽然资产更轻,但对产业链的掌控力较弱。
胡柏山的畅想能否实现,取决于三个因素:手机主业能否持续输血、AI能力能否保持领先、机器人商业化节奏是否符合预期。他强调,在五到十年的赛道周期中,持续性和稳定性比速度更重要。










