智谱科技在人工智能领域再推新作,其自主研发的GLM-4.7-Flash混合思考模型今日正式开源发布。该模型采用创新架构设计,总参数量达300亿,其中激活参数优化至30亿规模,在保持高性能的同时显著降低了计算资源消耗,为行业轻量化部署提供了全新解决方案。
作为同量级模型中的技术标杆,GLM-4.7-Flash在多项基准测试中展现出卓越表现。研发团队通过动态参数激活技术,实现了模型规模与推理效率的完美平衡,特别适用于边缘计算、移动端等资源受限场景。相较于前代GLM-4.5-Flash,新模型在保持核心性能指标的前提下,将推理速度提升了40%,能耗降低35%。
即日起,该模型将全面登陆智谱开放平台BigModel.cn,开发者可免费获取完整代码与训练框架。平台同步更新API接口,支持实时调用模型服务,并提供详细的部署指南和技术文档。此次开源包含模型权重、训练日志及微调工具包,为全球AI社区贡献重要技术资源。
技术白皮书显示,GLM-4.7-Flash采用混合专家系统架构,通过门控机制动态分配计算资源。在语言理解、逻辑推理等任务中,模型展现出接近百亿级参数模型的性能水平,而实际部署成本仅相当于传统30亿参数模型。这种创新设计为AI大模型的工程化应用开辟了新路径,特别适合需要快速响应的实时交互场景。










