滚动资讯

当前位置：首页 > 资讯 > 手机快报 > 正文内容

智谱新模型也用DeepSeek的MLA，苹果M5就能跑

时间：2026-01-20 19:07:43 来源：量子位编辑：快讯 IP：北京 发表评论无障碍通道

智谱AI上市后，再发新成果。

开源轻量级大语言模型GLM-4.7-Flash，直接替代前代GLM-4.5-Flash，API免费开放调用。

这是一个30B总参数、仅3B激活参数的混合专家（MoE）架构模型，官方给它的定位是“本地编程与智能体助手”。

在SWE-bench Verified代码修复测试中，GLM-4.7-Flash拿下59.2分，“人类最后的考试”等评测中也显著超越同规模的Qwen3-30B和GPT-OSS-20B。

作为去年12月发布的旗舰模型GLM-4.7的轻量化版本，GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力，同时针对效率做了专门优化。

除了编程，官方还推荐将这个模型用于创意写作、翻译、长上下文任务，甚至角色扮演场景。

30B参数只激活3B，MLA架构首次上线

GLM-4.7-Flash沿用了该系列的”混合思考模型”的设计。

总参数量300亿，但实际推理时仅激活约30亿参数，使模型在保持能力的同时大幅降低计算开销。

上下文窗口支持到200K，既可以云端API调用，也支持本地部署。

目前官方还没有给出技术报告，更多细节还要从配置文件自己挖掘。

有开发者注意到一个重要细节：GLM团队这次首次采用了MLA（Multi-head Latent Attention）架构。这一架构此前由DeepSeek-v2率先使用并验证有效，如今智谱也跟进了。

从具体结构来看，GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近，但专家数量有所不同——它采用64个专家而非128个，激活时只调用5个（算上共享专家）。

目前发布不到12小时，HuggingFace、vLLM等主流平台就提供了day0支持。

官方也在第一时间提供了对华为昇腾NPU的支持。

本地部署方面，经开发者实测在32GB统一内存、M5芯片的苹果笔记本上能跑到43 token/s的速度。

官方API平台上基础版GLM-4.7-Flash完全免费（限1个并发），高速版GLM-4.7-FlashX价格也相当白菜。

03-07

苹果智能家居中心设备或2026年秋季登场，7英寸屏、多版本设计引期待

03-07

内存缺货涨价成NVIDIA“机遇”？黄仁勋：供应受限促用户选高端显卡

03-07

苹果MacBook Neo发布：全铝机身设计，环保亲民但配置有取舍

03-07

华为Mate 80 Pro Max供货问题解决，多版本开放购买，4月15日前发货！

03-07

比亚迪技术革新：闪充与二代刀片电池引领汽车行业十大新趋势

03-07

技术狂潮席卷车市！一周内十一个品牌大型SUV竞相亮“绝活”

03-07

中兴通讯2025年报：营收增超10%达1338.96亿净利润降33.32%挑战仍存

中兴通讯近日披露了其2025年度经营业绩报告，数据显示公司全年实现营业收入1338.96亿元，较上年增长10.38%，但归属于上市公司股东的净利润同比下滑33.32%至56.18亿元。面对盈利压力，公司同步宣布将以股权登记日总股本为基数，向全体股东实施每10股派发现金红利4.11元（

03-07

苹果回应MacBook Neo设计：绝不向廉价塑料妥协

03-07

7999元起！华为Mate 80 Pro Max官网开放购买：4月15日前发货

03-07

苹果M5 Pro芯片GeekBench跑分曝光：多核破2.8万

03-07

三星Galaxy S26 Ultra手机确认首发ALoP镜头

03-07

鸿蒙智行问界M6“流光青”配色公布

03-07

vivo X300 Max手机原型曝光：预估6.78英寸屏幕

03-07

NVIDIA正享受“内存危机”：越缺货大家越买最好的显卡

03-07

点击查看更多 +

全站最新

雷军谈AI时代新愿景：未来每周工作或缩至3天，呼吁以开放心态拥抱变革

雷军邀海尔周云杰共探智能制造周云杰回应：期待交流，双方各有可学之处

尚界Z7来袭：华为ADS加持四驱性能强劲能否撼动轿车市场格局？

国产算力赋能！讯飞AI眼镜以40克轻量化设计开启跨国商务沟通新范式

25岁央视主持嫁大13岁企业家生三娃，不依附不躺平，携手共进书写人生新篇

保时捷入澳75周年献礼，四款“东南西北”定制车型诠释澳洲风情

热门内容

本栏最新

比亚迪技术革新：闪充与二代刀片电池引领汽车行业十大新趋势

技术狂潮席卷车市！一周内十一个品牌大型SUV竞相亮“绝活”

岚图FE新车剪影亮相配896线四激光雷达 2026年中旬将入市

科技豪华双加持昊铂A800携多重权益上市能否在中大型轿车市场突围？

鸿蒙智行问界M6再添新色「流光青」极低浓度色浆调配出通透青色魅力

鸿蒙智行技术焕新！尚界Z7轿跑猎装齐亮相，解锁年轻个性出行新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.