谷歌近日正式推出新一代开放模型系列Gemma 4,宣称这是其迄今为止最智能的开放模型。该系列专为复杂推理场景和智能体工作流设计,采用Apache 2.0商业许可证开源,包含四种不同规格的通用模型:20亿参数的高效版(E2B)、40亿参数的高效版(E4B)、260亿参数的混合专家模型(MoE)以及310亿参数的稠密模型(31B)。
在移动端和物联网设备领域,E2B与E4B模型通过优化推理时的参数激活量实现低功耗运行。前者仅激活约20亿参数,后者激活约40亿参数,这种设计显著降低了内存占用和电量消耗。目前这两个模型已与谷歌Pixel团队、高通、联发科等硬件厂商达成合作,支持在手机、树莓派、NVIDIA Jetson Nano等设备上实现近乎零延迟的离线运行。
26B MoE模型的创新之处在于其动态参数激活机制。在执行推理任务时,该模型仅需激活38亿参数,既保持了高运算效率,又完整保留了大型模型的知识储备。这种设计使其在处理复杂任务时,既能快速响应又能提供深度分析。
针对开发者和研究人员的需求,26B与31B模型专门优化了消费级GPU的兼容性。这使得用户无需依赖云端服务,即可将个人工作站转化为具备本地AI处理能力的服务器,特别适合学生、研究人员进行深度学习实验和模型开发。
谷歌DeepMind团队的研究人员Clement Farabet和Olivier Lacombe透露,通过优化算法架构,Gemma 4系列实现了"单位参数智能"的显著提升。以31B稠密模型为例,其在行业标准评测的开源模型榜单中已跻身前三,展现出超越参数规模的性能表现。
在智能体开发方面,Gemma 4系列实现了原生支持能力的大幅升级。相较于前代需要额外调整才能实现工具交互的模型,新一代产品直接集成了函数调用、结构化JSON输出、系统指令执行等功能,并支持超过140种语言。这种设计使开发者能够直接构建自主智能体,实现与第三方工具的无缝对接和多步骤任务规划。

















