滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

豆包大模型1.6-vision登场：首个具工具调用力的视觉深度思考新成员

时间：2025-10-01 18:24:48 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

火山引擎近日宣布，豆包大模型家族迎来重要更新，正式推出具备工具调用能力的视觉深度思考模型——豆包大模型1.6-vision。这款模型通过强化多模态交互能力，在视觉理解与推理领域实现突破性进展，能够以更高性价比满足企业级用户对图像精准处理的复杂需求。

作为豆包大模型系列首款支持工具调用的视觉模型，1.6-vision版本创新性地将图像处理指令融入思维链。该模型可模拟人类视觉认知模式，从全局图像扫描逐步聚焦至局部细节，实现对图片的定位、裁剪、要素点选、线条标注、缩放旋转等精细化操作。这种类人推理机制不仅提升了操作的可解释性，更显著提高了图像处理的效率与准确性。

技术升级带来显著成本优化。对比前代Doubao-1.5-thinking-vision-pro模型，新版本综合使用成本降低约50%。在32K输入输出场景下，单次处理费用从5.25元降至2.6元，为企业大规模部署视觉智能应用提供了更具竞争力的解决方案。

此次更新延续了豆包大模型的技术演进路线。今年6月推出的1.6版本已通过多模态思考能力强化对复杂场景的理解，此次视觉深度思考模型的发布，标志着该系列在跨模态交互领域形成更完整的技术矩阵。通过持续迭代，火山引擎正逐步构建覆盖文本、图像、视频等多维度的智能处理体系。

更多>同类资讯

英伟达Rosa CPU新架构Rigel揭秘：单核性能跃升，AI时代再添利器

07-08

追觅进军儿童互动市场：AI 毛绒玩具 Domi 以大模型开启智能陪伴新篇

07-08

蚂蚁集团周俊：万亿参数模型算力成本高企，创新策略转向提升Token密度破局

07-08

数据自主新选择：开源桌面AI助手Rowboat如何打造本地化高效工作台？

07-08

英伟达发布Audex模型：破解多模态难题，为语音技术行业注入新活力

07-08

Anthropic加速东海岸布局：纽约租赁16层办公楼，员工规模将扩至千人

07-08

消息称 Deepseek 入局AI芯片自研降低对英伟达等公司依赖

07-08

AI定制沟通工具：一位父亲为自闭症儿子打开“有声世界”的温暖实践

07-08

三星PM1763固态硬盘量产：为英伟达Vera Rubin平台AI应用提速降延

07-08

三星7月22日伦敦发布会来袭！Z Fold 8设计革新，剑指苹果折叠屏

07-08

英伟达Rosa CPU携Rigel核来袭单核性能提升或改写数据中心竞争格局

07-08

深圳理工大学2026年拟取消大学英语必修课聚焦跨文化交流能力培育

07-08

欧盟新规落地：7月7日起新车强制配备分心警告系统守护驾驶安全

07-08

长春净月高新区“FCN 未来算网”投运打造算力跨域协同新引擎

07-08

中国电信栾晓维：AI赋能转型流量经营迈向token经营新赛道

07-08

点击查看更多 +

全站最新

数峦云数字孪生管网平台：技术领先，助力城市管网智能化管理新篇章

百度旗下基金等入股觅蜂科技具身智能数据平台迎新股东助力

欧盟新规落地：7月7日起新车强制配备分心警告系统，守护驾驶安全新防线

92号与95号汽油怎么选？5个关键真相揭秘，车主必看避免踩坑多花钱

新款宝马X2谍照曝光！外观内饰升级，燃油纯电双版本2027年将至

享界G9前瞻：全系华为自研电机加持，标配四驱续航超1300公里

热门内容

本栏最新

德州仪器慕尼黑上海电子展亮剑：以系统级方案赋能下一代汽车电子革新

港科大企业家科创学者课程第三模块落幕：硬科技与AI融合，赋能科创未来

荣威家越07大五座SUV来袭：Momenta智驾加持，火山引擎赋能AI新体验

2026普通人学AI新路径：不学编程，四步走打造AI协作实用能力

蚂蚁灵波发布LingBot-Depth 2.0与LingBot-Vision，推动机器人视觉技术迈向新高度

9万级纯电SUV新选择！后置后驱+五连杆悬架，续航最长610km家用超合适

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.