滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌Gemini API再升级：Flex与Priority层级助力开发者灵活平衡成本与性能

时间：2026-04-03 23:40:24 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日宣布，其Gemini API将新增两种服务层级——Flex Inference与Priority Inference，旨在为开发者提供更灵活的成本与性能管理方案。这一调整允许开发者根据任务需求动态选择推理优先级，通过统一接口实现不同场景下的优化配置，无需再为同步与异步任务设计复杂架构。

随着AI应用场景的扩展，开发者常需同时处理两类任务：一类是允许较高延迟的后台计算，如大规模数据处理或模型深度推理；另一类是要求即时响应的交互任务，例如智能客服或实时协作工具。传统模式下，开发者需通过拆分系统架构、混合使用同步与异步API来满足需求，这增加了开发复杂度与维护成本。

Flex Inference专为成本敏感型任务设计。开发者将请求设置为该层级后，模型运行成本可降低约50%，但需接受更长的响应时间与较低的服务稳定性。谷歌建议，该模式适用于客户关系管理系统数据更新、科研模拟计算以及需要模型在后台进行多步骤推理的Agent工作流等非实时场景。

Priority Inference则聚焦于关键业务场景。该层级通过优先级调度机制，确保请求在系统高负载时仍能优先处理，从而提升服务可靠性。若用户设置的Priority流量超出配额，超出部分将自动降级至标准服务，避免应用中断。谷歌强调，实时客服系统、在线内容审核平台以及金融交易等对延迟与稳定性要求严苛的场景，均可通过该模式获得优化支持。

开发者可通过修改请求参数中的service_tier字段，直接调用这两种新层级，且二者均支持Gemini API的GenerateContent与Interactions接口。API返回结果将明确标注实际使用的服务层级，帮助开发者直观掌握性能表现与费用消耗。这一机制被视为谷歌降低AI应用规模化部署门槛的重要举措，为开发者在成本与性能之间提供了更精细的平衡选项。

更多>同类资讯

Meta硅谷再裁近200人：一边裁员瘦身一边加码AI赛道布局

04-03

谷歌推进太空数据中心计划，能源新解与挑战并存引关注

04-03

抖音集团短剧版权中心豪掷2亿，为真人短剧题材创新注入强劲动力

04-03

罗永浩力挺杨笠引争议霸气回应：退休可全职骂傻x不在乎脱粉

04-03

京东团购全国百城试运营开启，满99元领茶饮券，1分钱享星巴克自提优惠

04-03

天龙三号首飞失利：挫折中蕴藏希望，中国可重复火箭未来可期

所以，这个差异化给大家提一下，而天龙三号没有进行一级回收，并且首飞失败，并不是说它就不是可重复使用火箭，这是未来计划，就跟力箭二号一样，都是如此，这一次只是相关性的测试，也是走向可重复使用火箭最为关键，最为…

04-03

从亏损8亿到盈利近3亿，上海家化2025年如何走出“逆袭”之路？

04-03

AI浪潮下存储芯片涨价潮：旧手机“翻身”与产业链的“冰火两重天”

04-03

金星啤酒四十年沉浮：一罐茶啤引爆市场，迟到的IPO能否续写传奇？

04-03

小米瀚星创投等入股万通康达检测技术注册资本增至约322.3万

04-03

上海小米融资租赁公司注册资本增至8亿增幅达33%

04-03

有品信息科技公司工商变更：黎万强洪锋退出注册资本降至4000万

04-03

高盛看好比亚迪前景：2026年总销量或达505万辆海外业务成增长新引擎

04-03

京东与荣耀达成战略合作未来三年全渠道销售目标剑指千亿

04-03

阿里Wan2.7-Video大模型来袭，视频编辑自由度高，轻松实现创意改造

04-03

点击查看更多 +

全站最新

迈从北京旗舰店开业：线下空间搭建，完善用户认知体验转化全链路

TOP TOY更新招股书：营收净利双增，门店会员扩张自有IP成果显著

2027年起实施！移动电源新国标发布，多项要求强化产品安全保障

美国3月非农数据远超预期创逾一年高位

美国3月失业率小幅回落至4.3%

美媒：知情人士透露，伊朗击落了一架美国战斗机

热门内容

本栏最新

雷军直播拆解新一代SU7：锁单量破4万，交付提速，“百色计划”引期待

纽北赛道现身红色猛兽！小米YU7 GT实车曝光，千匹马力剑指最速SUV

车企营销新玩法：从流量接梗到人格破圈，2026车圈花式出圈大赏

意念操控未来新篇平安银行“企望中国行”与企业家共探强脑科技奥秘

中美Robotaxi“停车”事件引关注：是故障还是安全策略的探索？

中美无人车“停车”事件引热议：是谨慎之举，还是技术之困？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.