ITBear旗下自媒体矩阵:

谷歌Gemini API计费更新:多档位按需选,实时处理与省钱方案兼得

   时间:2026-04-03 19:27:32 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布对Gemini API的计费体系进行全面升级,推出涵盖标准、弹性、优先、批量及缓存在内的五类服务方案,旨在为不同场景下的AI推理需求提供更灵活的资源配置选项。此次调整通过差异化定价策略,既降低了特定场景下的使用成本,又为高实时性需求提供了性能保障。

针对大规模数据处理场景,新推出的弹性档位与批量档位均提供标准价格五折优惠。弹性档位通过动态调度非高峰时段的闲置算力,将目标延迟控制在1至15分钟区间,适用于对响应速度要求不苛刻的离线任务。批量档位则进一步放宽延迟限制至24小时,特别适合需要处理海量数据的用户,在信息检索、模型训练等场景中可显著降低计算成本。

对于实时交互类应用,优先档位通过专属资源池实现毫秒至秒级的延迟控制,虽然定价较标准方案高出75%至100%,但能确保客服机器人、金融风控等场景的即时响应需求。该档位采用动态资源分配机制,可根据流量波动自动调整算力供给,避免因资源不足导致的服务中断。

缓存档位创新性地引入词元计量模式,计费标准同时考量存储时长与数据规模。这种设计特别适用于需要重复调用复杂指令的对话系统、长视频内容分析以及大规模文档检索等场景。通过智能缓存机制,用户可减少重复计算带来的资源消耗,在保持系统响应效率的同时优化存储成本。

标准档位作为基础服务方案,保持原有定价体系,为常规推理任务提供稳定支持。用户可根据业务特性自由组合不同档位,例如在夜间使用弹性档位处理批量任务,日间切换至优先档位保障实时交互,形成资源利用的最优解。此次计费改革通过精细化分层策略,使AI服务定价与使用场景的匹配度得到实质性提升。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version