谷歌Gemma 4“小而精”突围：开源新章开启，端侧AI潜力待深度挖掘

时间：2026-04-04 06:34:14 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

Google推出的新一代开源模型Gemma 4，在发布短短数小时内便引发开发者社区的热烈讨论。这款模型包含E2B、E4B、26B（MoE）和31B四个版本，其中E2B和E4B可在手机、树莓派等设备上直接运行，26B和31B也仅需消费级显卡即可支持，打破了传统大模型对硬件的高要求。

与闭源的Gemini大模型追求“规模至上”不同，Gemma系列始终秉持“小而精”的设计理念。然而，Gemma 4的表现却超出预期——尽管参数规模未显著扩张，架构也未颠覆性创新，但在多项基准测试中，其性能已接近甚至超越更大规模的模型。例如，26B和31B版本在AI竞技场中与国产开源模型不相上下，甚至超越了参数规模达685B的DeepSeek V3.2和397B的Qwen 3.5。

Gemma 4的突破不仅体现在性能上，更在于其设计逻辑的革新。26B版本采用MoE架构，总参数虽为26B，但实际激活规模更小，这种设计使其在成本可控的前提下，实现了接近更大模型的效果。开发者在早期测试中发现，Gemma 4在代码生成、多模态理解等任务中表现稳定且高效，甚至在RTX 5090显卡上部署的31B版本，以及在Mac mini（M4 16GB）上运行的26B版本，均展现出良好的实用性。

开源协议的调整是Gemma 4的另一大亮点。此前，Gemma系列的开源协议因限制较多而饱受争议，此次Google全面采用Apache 2.0协议，允许个人和企业自由商用、再分发，彻底消除了开发者的后顾之忧。这一改变被视为Google重新布局开源生态的重要信号，也为模型在开发者中的普及奠定了基础。

Gemma 4的野心不仅限于性能提升，更在于推动本地AI应用的落地。E2B和E4B版本专为端侧设计，量化后体积可压缩至1.5GB以内，在树莓派5上能达到每秒100 tokens的推理速度。这种设计使AI系统得以在资源有限的设备上独立运行，无需依赖云端或API。更关键的是，Google联合高通、联发科等硬件厂商，从芯片到系统层面进行了深度优化，确保模型在端侧的流畅运行。

端侧AI的潜力因Gemma 4的推出而进一步显现。过去，手机等设备的AI功能多依赖云端模型，本地仅负责简单推理。而Gemma 4的E2B和E4B版本支持文本、图像、音频的多模态输入，甚至能参与多步Agent工作流，将更完整的AI能力直接嵌入设备。这种转变不仅提升了隐私安全性，也为操作系统与AI的深度融合提供了可能——当模型运行在SoC的NPU上，系统级组件便可调用本地模型完成推理、生成等任务，AI将真正成为操作系统的一部分。

在Agent时代，开源模型的竞争焦点正从“性能对决”转向“可用性比拼”。此前，meta的Llama奠定了开源生态的基础，而中国公司凭借Qwen、DeepSeek等模型在性能、成本和落地能力上逐渐反超闭源模型。Google此次通过Gemma 4的发布，明确了其“双线作战”的策略：Gemini系列继续对标GPT和Claude，守住商业化上限；Gemma系列则聚焦开发者、本地部署和生态扩展，填补开源领域的空白。

当前，Agent已成为行业焦点，开发者更关注模型的“干活”能力而非单纯对话或多模态表现。尽管Gemini在能力上仍属第一梯队，但在开发者心智中并未成为Agent的首选底座。Gemma 4的推出恰逢其时——它不仅解决了开源协议的痛点，更通过26B、31B和E2B、E4B版本，回应了“能否将AI能力直接搬到设备上运行”的核心问题。这一步或许不够激进，却为开源模型在Agent时代的竞争提供了新的思路。

天眼查工商信息显示，近日，有品信息科技有限公司发生工商变更，黎万强、洪锋退出股东行列，注册资本由5000万人民币减至4000万人民币，同时，部分高管发生变更。有品信息科技有限公司成立于2018年4月，法定代…

孙虎系统阐释山水三境创新模型：第一境“山水智境”，以AI与数字化技术赋能设计研发，携手百度等科技企业探索工业化建造路径；第二境“山水情境”，聚焦文化与自然的情感设计，以“场景替代产品”营造沉浸式人居体验；第…

谷歌提供四个不同版本的Gemma 4模型，它们的区别在于参数数量。 A：Gemma 4在Apache2.0许可证下发布，模型权重可通过Hugging Face、Kaggle和Ollama平台获取，用户可以…

从稚晖君到YeoHuiShyong，已有8位华为天才少年转战具身智能领域，他们集体转型的背后，折射出一个颠覆性趋势：机器人行业正在形成强大的人才虹吸效应。这些天才少年在华为积累的技术经验，成为他们转型的关键…

1、马斯克表示，Optimus3有望在今夏启动生产，并在2027年实现大规模量产，并宣布特斯拉正式停产Model S和Model X两款车型，目前已停止接受新车定制订单，消费者只能购买库存现车。在机器人系统…

根据灼识咨询报告，2025年以销售量计，公司在中国前五大柔性协作机器人和前五大轻负载工业机器人供应商中均排名第一，市场份额分别为47%和5.8%；同时，珞石多关节机器人在国内制造商中排名第三，在全球制造商中…

中国信息通信研究院云计算与数字化研究所副所长栗蔚：Token已经成为AI产业的重要度量衡，Token的消耗总量体现了智能体等创新AI应用的运用深度和广度，Token成本则体现了算法算力的效率。中国信息通…

4月3日消息，谷歌推出Gemma 4开源大模型，为其迄今最智能的开源模型系列，主打高级推理与智能体工作流，拥有领先的单位参数智能水平。据了解，该模型共推出四款规格，包括20亿参数E2B、40亿参数E4B、2…

在谷歌迄今为止所有的模型中，Gemma 4是目前最强大的开放权重模型系列，继承了前沿多模态、长上下文和高级推理能力，被谷歌官方称之为是“在逐字节比较下性能最强的”开放模型（Bytefor byte, th…

在科技飞速发展的今天，AI正逐渐融入我们的生活和工作。3月17日，科大讯飞股份有限公司带来了重磅消息----基于AstronClaw打造的桌面AI助理Loomy正式发布，为本地办公场景带来了全新的变革。Loo…

4月3日，内容赛道风云再起。抖音与小红书不约而同地在App搜索页面嵌入了“提问”功能，标志着两大流量巨头正式向知乎的传统腹地发起冲击。用户在搜索无果时，可直接发布图文问题求助，系统将通过算法将问题精准分发给…

针对这次拆车直播拆的是量产车还是试制车？对于车辆的安全性能，小米汽车介绍，新一代SU7全系升级的防弹涂层，不会与倒置设计冲突。在热安全方面，新一代SU7的方壳倒置电芯采用了防爆阀向下的设计，并设计了专用排气通…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.