手机圈AI激战正酣：端侧多模态崛起，生态构建初露锋芒

时间：2025-10-28 01:48:13 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

手机厂商正站在AI技术变革的前沿，以vivo、OPPO、荣耀为代表的头部企业，通过密集的技术发布与生态布局，将AI终端竞争推向新阶段。在近期举办的开发者大会上，AI战略升级成为核心议题，各家不仅展示了端侧多模态技术的突破性进展，更暴露出端云协同、生态共建与商业落地的深层挑战。

端侧多模态能力正重塑手机交互逻辑。vivo推出的18项端侧智能应用中，卡证识别、UI Agent等功能已突破传统语音助手的简单指令模式，实现通过自然语言完成备忘录创建、账单自动记录等复杂操作。OPPO的“一键问屏”技术则让AI具备实时理解屏幕内容的能力，用户可指着实体物品进行语音查询，而“一键闪记”功能通过扫描小票或微信支付记录，自动完成消费分类与提醒。荣耀披露的3000余个自动化场景，涵盖一键比价、自动领券、语音打车等跨应用操作，将原本需要多次切换App的流程压缩为单一指令。

技术演进呈现三大趋势：轻量化模型、深度推理与GUI操控。今年发布的端侧模型普遍聚焦3B参数规模，如荣耀的7B多模态感知大模型、vivo的3B多模态推理大模型及OPPO的0.6B-4B四档套件。这些模型通过低比特量化与端侧Lora训练技术，在保持性能的同时将体积压缩至传统模型的1/3以下。更关键的是，端侧推理模型已具备类似云端的深度思考能力，可处理复杂逻辑问题；GUI Agent技术则通过模拟人类操作界面，实现对第三方应用的主动操控，无需依赖API接口。

端云协同的矛盾日益凸显。尽管手机厂商普遍采用端云混合架构，但云侧模型调用仍面临多重困境。某手机厂商技术负责人透露，云厂商提供的API版本通常滞后内部最新模型3-6个月，且存在数据主权担忧——云服务商既怕手机厂商通过本地数据优化出更优模型，又担心自身技术被超越。这种矛盾促使厂商将重心转向端侧：vivo的3B模型在文本摘要任务中已达到云侧大模型98%的准确率，而运行内存占用从7B模型的4GB降至可接受范围。

商业落地遭遇成本与生态双重瓶颈。高频调用云侧ASR模型进行语音转录，每小时成本高达2元，这对出货量以亿计的手机厂商而言是巨大负担。更棘手的是，缺乏杀手级应用导致用户感知薄弱，芯片厂商因此对高端AI算力芯片持观望态度。高通骁龙与联发科天玑最新旗舰芯片虽具备100TOPS算力，但若缺乏应用场景支撑，高算力将直接推高芯片成本，形成恶性循环。

智能体生态建设进入深水区。当前自动化功能多局限于系统级应用，跨第三方App操作仍需解决安全授权标准。vivo通过构建“通控设施组”向生态伙伴开放屏幕感知、任务规划等基础能力，OPPO则将智能体框架作为跨设备协同的核心平台。荣耀的MCP架构已接入4000余个生态智能体，并尝试联动硬件生态。蚂蚁集团等互联网厂商已尝到甜头，其AI健康智能体在vivo生态中的流量份额半年增长300%，但多数App厂商仍担忧数据共享与流量分配问题。GUI大模型成为折中方案——AI仅模拟界面操作，关键节点仍需用户确认，既保留App价值，又实现自动化升级。

在这场AI终端竞赛中，手机厂商正从技术追随者转向生态定义者。他们既要突破端侧模型性能极限，又要平衡云侧合作与数据主权，更要说服互联网厂商共享生态红利。正如某厂商AI负责人所言：“这不仅是技术战，更是关于未来数字世界话语权的争夺。”当3B模型开始媲美云端性能，当GUI操控突破应用边界，手机AI的进化或许才刚刚揭开序幕。

换言之，我们常说的AI，强调的是其人造性，工具性，在此意义上，AI和一把锤子、一台电脑没区别，而达里奥·阿莫迪则认为，基于神经网络技术的AI，其发展接近于生命的演化。根据最新消息，上周四，Anthropi…

他进一步阐述了今年早些时候一次采访中表达过的观点：“从定义上讲，数据集是什么？“人工智能是一件好事，对每个行业都有益处，”泽尔尼克表示，“但它能复制或创造天才吗？它不过是一堆数据、一堆算力，再加上一个语言模型…

10月27日消息，谷歌为旗下AI聊天应用Gemini中的交互式工作区Canvas推出全新功能，瞄准学生与职场人群的演示文稿制作需求。此次更新后，用户只需输入文字指令，Gemini即可自动生成包含主题风格与配…

来源：大浪智库据了解，本届大会由微博、新浪新闻联合主办，清华大学经管学院EMBA倾力支持。大会将邀请科学家、企业家及人工智能领域的顶尖探索者，通过主题演讲、跨界对话、探索对话等形式，搭建跨界融合、开放多元的…

信华信（大连）数字技术有限公司，是一家面向国内客户提供领先的数智技术服务及解决方案的提供商，所属集团公司为信华信技术股份有限公司，是中国软件百强、第二大软件出口企业。上海之合网络科技有限公司（智合）成立于…

从AI编程助手到音乐生成模型，从类人机器人到社交信息流，这家公司正在尝试“重新发明互联网”。不少业内人士将这一策略比作早期的Facebook 和 Google：当平台的分发能力接近十亿用户，就可以开始“…

人形机器人产业链形成从核心部件到场景应用的完整闭环，上游核心部件国产化率达65%，供应链自主可控降低整机生产成本，人形机器人大模型涵盖大脑层、小脑层和肢体层三大类。大脑层企业以算法为核心，小脑层企业以控制…

论坛以“数智创新、赋能未来”为主题，汇聚了中国科学院院士徐宗本，长安大学未来交通学院院长、新加坡工程院院士Fwa Tien Fang等人工智能领域相关领军人物和国家级人才，共同探讨人工智能领域的痛点难题、前沿…

而现在，山姆·奥特曼正通过生成式AI工具，把“我们在网络上展示自己”转为“机器帮助我们定义自己”。对你我而言，这种变革或许看不见，但在打开ChatGPT、让机器帮我们写邮件、做决策、创意时，我们就是参与了…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.