滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

智谱发布GLM-4.5V视觉模型：解锁视觉理解新玩法，超越99%人类用户

时间：2025-08-12 15:42:11 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

智谱公司在近期宣布了一项重要进展，正式推出了其最新一代的视觉理解模型GLM-4.5V。这款模型是在智谱新一代文本基座模型GLM-4.5-Air的基础上训练而来，拥有惊人的1060亿参数和120亿激活参数，性能卓越。

GLM-4.5V引入了一项创新功能——思考模式开关，这一设计让用户能够自主决定模型是否启动深度思考模式。这一特性赋予了用户更多的控制权，可以根据实际需求灵活调整模型的工作状态。

在视觉能力方面，GLM-4.5V展现出了令人惊叹的表现。例如，它能够准确区分麦当劳和肯德基炸鸡翅的差异，从色泽、外皮质感等多个维度进行了细致入微的分析。GLM-4.5V还擅长看图猜地点，在与人类玩家的竞技中，仅用了7天时间就跻身拍图猜地点积分赛的第66名，超越了绝大多数人类用户，成绩斐然。

为了验证GLM-4.5V的实力，智谱公司在42个基准测试中对其进行了评估。结果显示，GLM-4.5V在41个测试中均超越了同尺寸模型的表现，充分证明了其强大的视觉理解和处理能力。

目前，GLM-4.5V已经在多个开源平台如Hugging Face、魔搭和GitHub上发布，并提供了FP8量化版本，方便开发者进行二次开发和应用。同时，智谱还为其打造了一款体验App，但目前仅支持Mac端（且需为非Intel芯片）用户下载使用。

用户可以通过z.ai平台选择GLM-4.5V模型，上传图片或视频进行体验。在智谱清言APP/网页版上，用户也可以上传图片开启“推理模式”，感受GLM-4.5V的强大功能。智谱还同步开源了一款桌面助手应用，该应用能够实时截屏、录屏，并利用GLM-4.5V处理多种视觉推理任务，如代码辅助、视频内容分析、游戏解答、文档解读等，极大地拓宽了模型的应用场景。

为了方便开发者使用GLM-4.5V，智谱开放平台BigModel.cn已经上线了GLM-4.5V API，并提供了2000万tokens的免费资源包。API的定价也相当亲民，每百万输入tokens仅需2元，每百万输出tokens为6元，支持图像、视频、文件和文本等多种输入方式。

随着GLM-4.5V的推出，智谱公司在视觉理解领域再次迈出了坚实的一步。这款模型凭借其卓越的性能和丰富的功能，无疑将成为开发者们的新宠，推动视觉理解技术不断向前发展。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

iPhone 17 Pro或采用创新天线设计，环绕摄像头提升信号性能

08-12

苹果新专利：六面玻璃iPhone设计曝光，或预示未来新方向

08-12

奥尔特曼：通用人工智能概念渐模糊，AI发展应聚焦具体能力分级

08-12

苹果与Apple Cinemas商标纠纷升级，双方各执一词争品牌权益

08-12

奥特曼发声：希望有人能调查马斯克被指控操纵X平台事件

08-12

B站新推“花生AI”视频创作工具，智能匹配素材3分钟速成高质量视频

08-12

广汽华为联手华望汽车，正式启动渠道招商，布局高端市场

08-12

微软豪掷17亿美金，推行环保新招：深埋490万吨排泄物固碳

08-12

OpenAI AI系统在2025国际信息学奥赛中夺金，逻辑推理能力超98%人类选手

08-12

ChatGPT-5：智能助手还是认知衰退加速器？

08-12

苹果watchOS 26 Beta 6更新推送，开发者预览版再升级

08-12

小米手表S4 41mm内测招募：新增微信语音提醒，运动健康全面升级

08-12

iPhone 17 Pro设计新动向：苹果创新天线布局提升信号性能

08-12

AirPods或将新增面对面实时翻译功能，iOS 26 Beta 6图像曝光

08-12

山寨版iPhone 17 Pro曝光：安卓内核披上iOS外衣，真假难辨引热议

08-12

点击查看更多 +

全站最新

广汽华为联手华望汽车，正式启动渠道招商，布局高端市场

微软豪掷17亿美金，推行环保新招：深埋490万吨排泄物固碳

OpenAI AI系统在2025国际信息学奥赛中夺金，逻辑推理能力超98%人类选手

ChatGPT-5：智能助手还是认知衰退加速器？

苹果watchOS 26 Beta 6更新推送，开发者预览版再升级

小米手表S4 41mm内测招募：新增微信语音提醒，运动健康全面升级

热门内容

本栏最新

广汽华为联手华望汽车，正式启动渠道招商，布局高端市场

微软豪掷17亿美金，推行环保新招：深埋490万吨排泄物固碳

OpenAI AI系统在2025国际信息学奥赛中夺金，逻辑推理能力超98%人类选手

ChatGPT-5：智能助手还是认知衰退加速器？

苹果watchOS 26 Beta 6更新推送，开发者预览版再升级

小米手表S4 41mm内测招募：新增微信语音提醒，运动健康全面升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.