滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌升级Gemini API：新增Flex与Priority推理层级

时间：2026-04-03 23:54:50 来源：鞭牛士编辑：快讯 IP：北京 发表评论无障碍通道

AIPress.com.cn报道

4月3日消息，谷歌宣布为Gemini API新增两种服务层级，Flex Inference与Priority Inference，以帮助开发者在成本与系统可靠性之间进行更精细的权衡。新机制通过统一接口实现，使开发者能够根据不同任务需求动态调整推理优先级。

随着AI应用从简单对话扩展到更复杂的Agent系统，开发者通常需要同时处理两类任务：一类是无需即时响应的大规模后台任务，例如数据处理或模型“思考”过程；另一类则是面向用户的实时交互任务，如聊天机器人或Copilot工具。这两类任务在延迟和稳定性上的需求差异较大。

此前，开发者往往需要在同步API与异步Batch API之间拆分架构以满足不同需求。谷歌表示，新推出的Flex与Priority层级旨在简化这一流程，使开发者能够通过同一套同步接口处理不同类型的工作负载。

Flex Inference是一种面向成本优化的推理模式，适用于对延迟不敏感的任务场景。开发者在将请求设置为Flex层级后，可以以标准API约一半的价格运行模型，但相应地需要接受更高延迟以及较低的服务可靠性。谷歌表示，该模式适用于客户关系管理数据更新、大规模研究模拟以及需要模型在后台进行复杂推理的Agent工作流。

与之相对，Priority Inference则是面向关键业务场景的高可靠性推理服务。该模式在平台负载较高时仍能优先处理请求，从而提高系统稳定性。若用户的Priority流量超过配额，超出的请求会自动降级至标准服务层级，而不会直接失败，以确保应用持续运行。

谷歌表示，Priority模式适用于实时客服系统、在线内容审核以及对响应速度和稳定性要求较高的应用场景。API返回结果还会标明实际使用的服务层级，使开发者能够更清晰地了解性能表现与计费情况。

两种新服务层级均可通过设置请求参数中的service_tier字段进行调用，并适用于Gemini API中的GenerateContent与Interactions接口。谷歌称，这一机制旨在为开发者提供更灵活的成本与性能控制，以支持AI应用在生产环境中的规模化部署。（AI普瑞斯编译）

更多>同类资讯

AI视频生成赛道风起云涌，快手可灵或拆分上市开启新征程

05-13

快手分拆可灵AI拟上市：借200亿美元估值，能否破局AI视频生成赛道？

05-13

字节跳动等团队新突破：AI视频生成“预见未来”，流畅度与质量双提升

05-13

小米米家智能电热水器C 60L京东发售，60L大容量搭配6倍增容，首发价799元

05-13

绵阳上演机器人“巅峰对决”！产学研协同创新助力科技民生融合发展

05-13

智元进军香港：2026开启具身智能部署元年，机器人迈向实用新阶段

05-13

摩尔线程MUSA纳入SGLang核心阵列，携手推进国产算力与推理框架深度融合

05-13

谷歌携手多家OEM厂商升级品牌 Chromebook或变身Googlebook引期待

05-13

宇树载人机甲亮相，微信状态访客测试，快手AI重组，机建燃油费再涨引关注

05-13

特斯拉停产Model S与X：战略转向人形机器人开启“物理AI”新篇章

05-13

谷歌发布Googlebooks高端安卓笔记本宏碁华硕等多品牌秋季首发亮相

05-13

小米17 Max即将登场：8000mAh大电池加持 5月下旬发布引期待

05-13

2026移动云大会苏州启幕兆芯携多款自主算力成果及安全技术亮相

05-13

荣耀600系列官宣来袭！肖战续任代言，配置亮点全解析

05-13

小米YU7 GT“车厘子红”实车无伪装路测，性能强劲，5月底将正式发布

05-13

点击查看更多 +

全站最新

李想谈AI芯片变革：理想自研马赫M100亮相，四年前选择获强悍验证

比亚迪第三代元PLUS 5月21日上市续航630公里配二代刀片电池与智驾系统

中央网信办推进短视频规范标注 6类必选标签成发布“硬门槛”

微信状态内测“访客记录”引网友热议隐私边界与社交自由成焦点

智启教育新程：数智技术赋能全球教育多元创新与均衡发展

广汽丰田铂智3X：14个月销量破10万蝉联8月销冠香港市场也表现亮眼

热门内容

本栏最新

微信状态内测“访客记录”引网友热议隐私边界与社交自由成焦点

智启教育新程：数智技术赋能全球教育多元创新与均衡发展

广汽丰田铂智3X：14个月销量破10万蝉联8月销冠香港市场也表现亮眼

5月11日石头科技大宗交易现折价17.91% 主力资金净流入超两千万

新能源SUV激战正酣：奥迪E7X携900V入场，问界M7、小米YU7如何接招？

小米YU7 GT“车厘子红”实车无伪装路测，定位跑车级SUV 5月底将发布

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.