4月2日,智谱宣布GLM-5V-Turbo正式发布,据介绍,GLM-5V-Turbo是面向视觉编程推出的多模态Coding基座模型。
官方表示,该模型最大突破在于深度融合视觉与编程能力,能够原生理解图片、视频、设计稿、文档版面等多模态输入,并支持画框、截图、读网页等多模态工具调用,同时擅长编程、长程规划、操作执行等复杂任务。GLM-5V-Turbo让OpenClaw龙虾具备了真正的视觉能力,能看懂屏幕上的信息。
目前,该模型已通过智谱MaaS平台开放接入。
4月2日,智谱宣布GLM-5V-Turbo正式发布,据介绍,GLM-5V-Turbo是面向视觉编程推出的多模态Coding基座模型。
官方表示,该模型最大突破在于深度融合视觉与编程能力,能够原生理解图片、视频、设计稿、文档版面等多模态输入,并支持画框、截图、读网页等多模态工具调用,同时擅长编程、长程规划、操作执行等复杂任务。GLM-5V-Turbo让OpenClaw龙虾具备了真正的视觉能力,能看懂屏幕上的信息。
目前,该模型已通过智谱MaaS平台开放接入。