ITBear旗下自媒体矩阵:

苹果Ferret-UI Lite端侧AI模型:3B参数小身躯,精准驾驭复杂UI界面

   时间:2026-02-21 10:09:41 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

苹果研究团队近日发布了一项突破性成果——专为移动设备设计的多模态大语言模型Ferret-UI Lite。该模型参数量仅30亿,却在性能测试中展现出与参数量大24倍的服务器端模型相当甚至更优的表现,为移动端AI应用开辟了新路径。

传统大型模型在处理手机屏幕内容时,常因分辨率限制或图标尺寸过小而出现识别偏差。Ferret-UI Lite通过引入"推理时裁剪"技术,在首次粗略预测后,会智能锁定目标区域进行局部放大处理,如同人类调整视觉焦点观察细节。这种策略显著降低了模型对整体图像的处理需求,使其在算力有限的设备上也能精准捕捉界面元素。

研究团队针对移动端数据稀缺的痛点,开发了包含"任务生成器-规划器-执行者-批评者"四模块的合成数据系统。该系统通过模拟用户操作场景,让AI在虚拟环境中自主完成交互任务并修正错误,生成的数据集不仅规模庞大,更包含大量真实操作中可能出现的异常情况,如无响应按钮或弹窗干扰等。实验表明,这种训练方式比传统人工标注数据更能提升模型鲁棒性。

在基准测试中,Ferret-UI Lite展现出优异的基础交互能力,可准确完成点击、滑动等短流程操作。尽管在处理需要多步骤协同的复杂任务时仍有优化空间,但其本地化运行特性已成为显著优势。该模型完全在设备端处理数据,无需上传屏幕截图至云端,在实现自动化操作的同时,有效保护了用户隐私安全。

这项成果标志着移动端AI模型进入轻量化高效能的新阶段。通过创新性的数据处理机制和架构设计,小参数量模型首次在性能上比肩大型服务器模型,为智能手机、平板电脑等设备实现更智能的界面交互提供了技术基础。研究团队已公开相关技术细节,供学术界和产业界进一步探索优化。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version