在近日举办的FORCE原动力大会上,火山引擎展示了其AI技术的最新成果,推出了一系列创新产品与服务,标志着字节跳动在人工智能领域的又一重大进展。
火山引擎此次推出的核心亮点之一是豆包大模型1.6系列。该系列包含doubao-seed-1.6、1.6-thinking及1.6-flash三个版本,均支持256K上下文处理。其中,1.6-thinking在推理能力和指令执行上表现卓越,超越了DeepSeek-R1-0528模型,并逐步缩小了与OpenAI-03-high的差距。尤为豆包1.6系列采用了创新的定价策略,按“输入长度”区间定价,使得深度思考、多模态能力与基础语言模型的价格统一。在企业常用的0-32K输入区间内,豆包1.6的输入价格仅为0.8元/百万tokens,输出价格为8元/百万tokens,综合成本降低至豆包1.5深度思考模型或DeepSeek R1的三分之一。
火山引擎还推出了豆包·视频生成模型Seedance 1.0 pro。该模型在Artificial Analysis评测榜单的文生视频和图生视频两项任务中均夺得首位,超越了Veo3、可灵2.0等多模态模型。Seedance 1.0 pro的性价比极高,每千tokens仅需0.015元,生成一条5秒的1080P视频成本仅为3.67元,意味着1万元预算可以制作超过2700条此类视频,被火山引擎誉为业界最低成本。
火山引擎的AI云原生服务也迎来了全面升级,推出了多项面向Agent开发和应用的工具产品,包括火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等。同时,还推出了多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件,进一步丰富了其AI服务生态。
火山引擎的数据显示,豆包大模型日均tokens使用量已超过16.4万亿,自去年5月首次发布以来增长了137倍。根据知名行研机构IDC的报告,豆包大模型在中国公有云大模型市场份额中排名第一,占比高达46.4%。
豆包大模型1.6系列不仅在推理能力上有所提升,还支持多模态理解和图形界面操作,能够理解和处理真实世界问题。这一能力已应用于豆包APP的实时视频通话功能,并在电商商品审核、自动驾驶标注、安全巡检等企业场景中展现出广泛应用潜力。1.6系列的图形界面(GUI)操作能力使用户能够跨平台执行一系列智能体任务,如自动操作浏览器完成酒店预定、识别购物小票并整理成Excel表格等。
火山引擎在此次大会上还宣布,豆包视频生成模型Seedance 1.0 pro和豆包·实时语音模型已全面上线,并对企业客户开放使用。Seedance 1.0 pro具备无缝多镜头叙事、多动作随心运镜、稳定运动与真实美感三大特性,支持文字与图片输入,可生成高品质1080P视频。而豆包·实时语音模型则支持高级自然语言指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,更加拟人化。
火山引擎智能算法负责人吴迪表示,构建高生产力的Agent需要既用好AI,整合高质量应用,又做好AI,关注底层技术的优化和创新。为此,火山引擎推出了12款Agent开发工具产品,旨在提升开发效率和AI应用的质量。这些工具产品包括TRAE、MCP服务、PromptPilot、AI知识管理产品、veRL强化学习框架等,为企业提供了从开发到部署的全流程支持。