ITBear旗下自媒体矩阵:

谷歌发布Gemma 3 270M小模型,性能强劲专为任务微调设计

   时间:2025-08-15 20:48:45 来源:机器之心Pro编辑:快讯团队 IP:北京 发表评论无障碍通道
 

谷歌本周四震撼发布,其Gemma系列再添新成员——Gemma 3 270M。这款小巧而强大的语言模型,尽管文件大小仅241MB,却内含2.7亿个精心设计的参数,专为特定任务微调而生,展现了卓越的指令执行与文本结构化能力。

Gemma 3 270M继承了该系列的先进架构与强大的预训练基础,其指令执行能力在同级别模型中脱颖而出。谷歌公布的IFeval基准测试结果显示,这款模型树立了新的性能标杆,使得复杂的AI功能得以轻松应用于设备端及研究场景。

IFeval测试专注于评估模型执行可验证指令的效能。Gemma 3 270M的出色表现,得益于其紧凑而强大的架构设计:1.7亿个嵌入参数与1亿个Transformer模块协同工作,配合256k的庞大词汇量,使其能处理罕见token,成为进一步微调的坚实基础。

节能是Gemma 3 270M的另一大亮点。在Pixel 9 Pro手机SoC上的内部测试中,INT4量化模型在25次对话中仅消耗0.75%的电量,堪称Gemma系列中最节能的型号。模型附带的指令调整与预训练检查点,使其即便非为复杂对话设计,也能轻松遵循通用指令。

谷歌强调,Gemma 3 270M作为一款高质量基础模型,开箱即用,尤其适合专业化任务。其小巧的体积与高效能,为构建精简、快速且成本低廉的生产系统提供了可能。这一点已在实践中得到验证,如Adaptive ML与SK Telecom合作,通过微调Gemma 3 4B模型,在多语言内容审核上取得显著成效。

Gemma 3 270M的推出,旨在让开发者更深入地利用专业化方法,为明确任务释放更高效能。它不仅是创建一系列小型专业模型的理想起点,还能助力个人开发者构建创意应用,如Hugging Face团队利用该模型支持的一款睡前故事生成器网页应用。

谷歌指出,Gemma 3 270M适用于多种场景,包括高容量且定义明确的任务、对时延要求高的任务、需要快速迭代和部署的工作,以及需确保用户隐私的任务。谷歌还提供了快速入门方案与工具,包括在Gemma文档中的完整微调指南,以及Vertex AI上的模型试用,让开发者能够轻松上手。

自今年4月以来,谷歌Gemma开放模型系列持续发布新品,从Gemma 3和Gemma 3 QAT,到面向移动端的Gemma 3n,不断为不同平台带来强大的AI性能。截至目前,Gemma系列的累积下载量已突破两亿次,彰显了其广泛的影响力与市场需求。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version