ITBear旗下自媒体矩阵:

谷歌推出FunctionGemma:让手机等边缘设备也能“听懂”指令高效执行

   时间:2025-12-20 22:16:06 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布推出一款名为FunctionGemma的新型专用模型,该模型基于Gemma 3 270M架构进行专项微调,旨在将强大的函数调用能力引入手机等边缘设备。这一创新标志着行业从传统对话式接口向主动式智能体转型的重要进展,开发者对本地化任务执行的需求因此得到有力响应。

FunctionGemma的核心优势在于其轻量化设计,继承了Gemma系列的紧凑特性。通过专项优化,该模型能够在智能手机和嵌入式系统等算力受限的设备上独立运行,无需依赖云端服务。这种设计不仅降低了延迟,还显著提升了边缘设备的自主处理能力,使其能够精准解析用户指令并调用相应功能。

与通用大模型不同,FunctionGemma专注于“定制化”场景。它既能与用户进行自然对话,又能生成结构化的函数调用代码,直接指挥计算机执行任务。例如,在“移动操作”测试中,未经微调的基础版本准确率为58%,而经过针对性优化后,执行复杂指令(如“明天约午饭并添加到日历”或“将昨日拍摄的美食照片发送给母亲”)的准确率提升至85%。

为了适应边缘设备的算力和电池限制,FunctionGemma采用了高效的数据处理方式。它利用Gemma的256k词表,能够快速处理JSON数据和多语言输入,进一步减少了运行延迟。这一特性使其在资源受限的环境中依然保持流畅性能。

在硬件适配方面,FunctionGemma已支持NVIDIA Jetson Nano等开发板及主流移动设备。它甚至可以作为“交通指挥官”,处理简单任务,并将复杂逻辑路由至更大的Gemma 3 27B模型,形成分层处理架构。这种灵活性为开发者提供了更多应用场景的可能性。

谷歌为降低开发门槛,构建了广泛的生态支持体系。开发者可通过Hugging Face、Kaggle等平台下载模型,并利用Unsloth、Keras或NVIDIA NeMo等工具进行微调。在部署环节,该模型全面兼容LiteRT-LM、vLLM、Llama.cpp和Ollama等工具,进一步简化了开发流程。

为了直观展示FunctionGemma的能力,谷歌同步发布了TinyGarden游戏演示和“移动操作”微调指南。在游戏中,玩家通过语音指令管理虚拟土地,例如“在最上面一排种向日葵并浇水”。模型会将指令分解为具体操作,如针对特定坐标的“种植作物”或“浇水作物”。这款游戏完全在浏览器中本地运行,由FunctionGemma和Transformers.js提供支持,展现了自然语言处理在物理模拟中的潜力。

实际应用中,FunctionGemma能够解析多种自然语言指令并识别正确的操作系统工具。无论是创建日历事件、添加联系人,还是打开手电筒,该模型都能快速响应并执行命令。这种能力为边缘设备的智能化提供了新的解决方案,推动了端侧智能体的普及。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version