ITBear旗下自媒体矩阵:

豆包大模型1.6-vision登场:首个具工具调用力的视觉深度思考新成员

   时间:2025-10-01 18:24:48 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

火山引擎近日宣布,豆包大模型家族迎来重要更新,正式推出具备工具调用能力的视觉深度思考模型——豆包大模型1.6-vision。这款模型通过强化多模态交互能力,在视觉理解与推理领域实现突破性进展,能够以更高性价比满足企业级用户对图像精准处理的复杂需求。

作为豆包大模型系列首款支持工具调用的视觉模型,1.6-vision版本创新性地将图像处理指令融入思维链。该模型可模拟人类视觉认知模式,从全局图像扫描逐步聚焦至局部细节,实现对图片的定位、裁剪、要素点选、线条标注、缩放旋转等精细化操作。这种类人推理机制不仅提升了操作的可解释性,更显著提高了图像处理的效率与准确性。

技术升级带来显著成本优化。对比前代Doubao-1.5-thinking-vision-pro模型,新版本综合使用成本降低约50%。在32K输入输出场景下,单次处理费用从5.25元降至2.6元,为企业大规模部署视觉智能应用提供了更具竞争力的解决方案。

此次更新延续了豆包大模型的技术演进路线。今年6月推出的1.6版本已通过多模态思考能力强化对复杂场景的理解,此次视觉深度思考模型的发布,标志着该系列在跨模态交互领域形成更完整的技术矩阵。通过持续迭代,火山引擎正逐步构建覆盖文本、图像、视频等多维度的智能处理体系。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version