ITBear旗下自媒体矩阵:

谷歌Gemini 3.1 Flash-Lite发布:速度快成本低,多模态与推理能力再升级

   时间:2026-03-04 11:10:37 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日面向开发者群体推出了一款名为Gemini 3.1 Flash-Lite的AI模型,该模型凭借其高速响应与成本优势,成为Gemini 3系列中针对高频工作负载的性价比之选。据官方披露,这款模型专为大规模、低延迟任务设计,支持文本、图像、音频及视频等多模态输入,上下文窗口容量达百万token级别,输出上限为6.4万token,可覆盖从文件摘要到复杂多模态处理的多样化场景。

在性能表现上,谷歌援引第三方基准测试数据指出,相较于前代Gemini 2.5 Flash,新模型的首个答案生成速度提升2.5倍,整体输出效率提高45%,且在质量评估中保持同等或更优水平。在智能能力评估方面,该模型于Arena.ai排行榜斩获1432分,并在GPQA Diamond与MMMU Pro两项专业测试中分别取得86.9%与76.8%的成绩,超越同级别竞品的同时,甚至部分指标优于上一代更大规模模型。

定价策略成为该模型的核心竞争力之一。谷歌宣布,Gemini 3.1 Flash-Lite的输入成本为每百万token 0.25美元,输出成本为每百万token 1.50美元,仅为大型模型报价的零头。这一定价体系特别针对需要大规模部署且对成本敏感的企业用户,例如从事翻译、内容分类等高频任务的开发者群体。

早期测试阶段,多家企业已验证该模型的实际效能。AI叙事平台Latitude反馈称,新模型在指令遵循成功率上较此前模型提升20%,推理速度加快60%,使其能够为更广泛的用户提供复杂叙事体验。AI动画工具Cartwheel首席科学家Andrew Carr则强调,该模型在工具调用与代码库探索方面表现出色,其处理速度达到更大规模模型的数倍,成为处理多模态标注数据的关键工具。时尚应用Whering通过整合该模型,实现了商品标签标注的100%一致性,即使在复杂品类分类中也能保持稳定输出。

企业AI平台HubX联合创始人Kaan Ortabas公布的数据显示,Gemini 3.1 Flash-Lite在根编排与内容处理任务中,持续保持10秒以内的响应时间,流式输出接近实时水准,结构化输出合规率达97%,意图路由准确率达94%,在速度、精准度与成本间取得平衡。目前,该模型已通过谷歌AI Studio的Gemini API与谷歌云Vertex AI平台向开发者开放,无需特定硬件配置即可直接调用。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version