近日,火山引擎在其官方平台上推出了三款全新的AI大模型,分别是豆包大模型1.6、豆包视觉理解模型以及豆包视频生成模型。这一系列新品发布标志着火山引擎在AI技术领域的又一次重大突破。
豆包大模型1.6在功能上进行了全面升级,拥有了更为强大的推理能力和多模态理解能力。它还具备了GUI操作能力和前端页面编程能力,使得用户在使用过程中的操作更为便捷和高效。与此同时,豆包视觉理解模型则展现出了对视觉内容的卓越识别和理解能力,不仅能够进行细致入微的视觉描述,还拥有了更强的推理能力。豆包视频生成模型则可以将用户的文本和图像转化为高质量的视频,生成的影视作品细节层次丰富,视觉效果出众。
在FORCE Link AI创新巡展的厦门站上,火山引擎进一步发布了豆包图像编辑模型3.0和豆包同声传译模型2.0,并对豆包大模型1.6系列进行了全新升级。豆包图像编辑模型3.0在精度和效率上均实现了显著提升,能够支持高清细节修复、风格迁移等复杂创意场景,为用户提供了更为丰富的图像编辑体验。豆包同声传译模型2.0则在多语言实时翻译能力上进行了优化,特别是在专业术语和跨文化语境理解方面,表现尤为出色。
火山引擎在此次发布中还强调了其生态开放的理念。公司宣布将开源扣子核心能力,开放模型微调框架等技术模块,以降低开发门槛,推动AI技术的普及和应用。同时,火山引擎还推出了企业自有模型托管方案,支持私有数据训练模型的安全部署与运维,为企业提供了更为可靠和高效的AI解决方案。Responses API标准化接口的上线,将助力企业快速集成对话、生成等AI能力,进一步缩短应用开发周期,提升企业的市场竞争力。